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PRESENTACION 


C uando OjoPublico salio en linea en el 2014 nos propu- 
simos innovar en los diferentes ambitos del periodismo 
en Peru y Latinoamerica. Desde mejorar en la publica- 
tion de contenido de investigacion e implementar nuevas narrativas 
digitales para quebrar los tradicionales formatos, hasta explorar el 
modelo de negocio ideal mientras intentamos construir una moder- 
na redaccion integrada por periodistas y tecnologos. Todos agrupa- 
dos bajo la siguiente predica: contar historias de calidad que otros 
medios prefieren obviar, reportajes incomodos para el poder, pero 
relevantes para la opinion publica y necesarios para el ciudadano. 

“La navaja suiza del reportero: herramientas de investigacion en 
la era de los datos masivos” es la primera prueba en formato edito- 
rial de este precepto periodistico. Patrocinado por Hivos de Holan- 
da en alianza con el Consejo de la Prensa Peruana (CPP), y escrito 
por David Hidalgo y Fabiola Torres, es una poderosa radiografia del 
trabajo del reportero en esta epoca de information calculada en te- 
rabytes. Didactico, riguroso y agil, este manual profundiza en los me- 
jores trabajos realizados por el periodismo de datos contemporaneo. 

En la guia que usted tiene en sus manos podra identificar a los 
equipos de elite de la prensa mundial mientras marcan tendencia 
a nivel planetario con investigaciones basadas en el analisis y la vi- 
sualization de millones de documentos. Desde la filtration del Caso 
Wikileaks en el ano 2010 -que origino la primera alianza entre dos 
mundos para contar una historia sin precedentes: la organization del 
hacker y programador Julian Assange y la redaccion de The Guar- 
dian, uno de los diarios mas innovadores del mundo-, hasta los des- 
tapes mundiales del Consorcio International de Periodistas de In- 
vestigacion (ICIJ) sobre los paraisos fiscales, en los anos siguientes. 

El lector de “La navaja suiza del reportero” recorrera una selec- 
tion de los principales casos de periodismo de datos a nivel inter- 


nacional y conocera las herramientas digitales mas usadas por las 
mejores redacciones del mundo para limpiar, analizar y visualizar 
grandes cantidades de informacion. Desde las mas conocidas como 
Open Refine, creada por Google hace mas de un lustro y una de mis 
favoritas, hasta otras mas complejas como el Neo4J, utilizada por el 
equipo de OjoPublico -este ano, en plena campana electoral- para 
crear un especial inedito sobre el financiamiento de los partidos po- 
liticos y las campanas presidenciales del Peru en la ultima decada. 

En el manual de casi 100 paginas -una suerte de cronica sobre los 
reporteros en transito al uso de la tecnologia- el lector descubrira que 
los periodistas de investigacion ya no pueden trabajar aislados como 
lobos solitarios. La simbiosis creada con los escritores de codigo ha 
llevado esta profesion a horizontes desconocidos en la exploration 
de documentos que antes hubieran sido imposibles de analizar por 
cualquier medio de comunicacion en el mundo. Tambien recordamos 
la esforzada labor de los pocos periodistas nacionales que intentaron 
trabajar con datos en la decada secretista de los ’90, en pleno gobier- 
no autoritario de Alberto Fujimori, hasta los inicios del nuevo siglo. 

En tiempos en los que los periodistas escriben bajo la sombra de 
una industria de medios declarada en vias de extincion, presionados 
por la generation inmediata de contenido viral y sometidos a la dic- 
tadura del trafico facil en internet, “La navaja suiza del reportero” 
aporta ideas y soluciones para descubrir las mejores practicas del 
periodismo en la era digital. Si en aquella breve imagen de la pelicula 
Spotlight, en la que aparece un periodista del Boston Globe frente a 
una hoja de calculo, podemos avistar los origenes del periodismo de 
investigacion en la era de los datos masivos, en “La navaja suiza del 
reportero” podremos vislumbrar nuestro presente y, quiza, nuestro 
futuro. 


Oscar Castilla C. 
Director Ejecutivo 
OjoPublico 


PROLOGO 


a La navaja suiza del reportero: herramientas de investiga- 
cion en la era de los datos masivos” fue un esfuerzo inicial- 
mente concebido como una guia practica para difundir y 
promover el uso de data por parte de periodistas y activistas intere- 
sados en explorar, interpretar y contrastar la informacion disponible 
en el infinito universo digital. Sin embargo, la publication que usted 
tiene en las manos, elaborada por David Hidalgo y Fabiola Torres 
-Director Periodfstico y Editora de Analisis de Datos de la Asocia- 
cion de Periodismo de Investigacion OjoPublico-, supero nuestras 
expectativas. Para el Consejo de la Prensa Peruana representa, en 
principio, una antologla sobre el desarrollo y potencia de un gene- 
ro de periodismo insuficientemente desarrollado en nuestro medio. 
Pero sobre todo es un manual que revela como esta profesion, al in- 
corporar el uso de la tecnologia, ha dado como resultado algunas de 
las mejores investigaciones de los ultimos tiempos y tiene un amplio 
margen para elevar sus estandares en beneficio de los ciudadanos y 
de la cultura democratica. 

“La navaja suiza del reportero” entra en circulation en un mo- 
mento oportuno: el ano 2016 marca un punto de quiebre en materia 
del derecho ciudadano de acceso a la informacion publica. En la es- 
fera oficial observamos la creciente erosion de los mecanismos anti- 
corruption establecidos para impulsar temas fundamentales como 
la lucha contra la cultura del secreto, intensamente arraigada en el 
Peru. Del mismo modo, se hace evidente el incumplimiento de los 
compromises de transparencia, participation ciudadana y rendition 
de cuentas asumidos por el Peru en el marco de la Alianza por un 
Gobierno Abierto. 

Lo paradojico es que este retroceso coincidio con un giro en las 
prioridades establecidas por el ente rector en esta materia, la Secre- 
taria de Gestion Publica de la Presidencia del Consejo de Ministros. 


Desde mediados del 2015, esta entidad priorizo la implementacion 
de la Estrategia de Apertura y Reutilizacion de Datos Abiertos Gu- 
bernamentales en el Peru, en el contexto de las iniciativas desple- 
gadas por el Gobierno peruano con el fin de alcanzar los estandares 
establecidos para integrar la Organizacion para la Cooperacion y el 
Desarrollo Economico (OCDE). 

Pese al tiempo transcurrido, las iniciativas planteadas desde el 
Estado son insnficient.es e inconsistentes. 

Por suerte no sucede lo mismo en otros escenarios del quehacer 
nacional. El pais hoy cuenta con un joven, pero dinamico y creciente 
grupo de activistas que utilizan la data disponible para desarrollar 
herramientas y producir informacion y liberarla con el fin de mejorar 
la calidad de vida de los ciudadanos. Ejemplo de ello son los cada vez 
mas frecuentes hackatones, concursos y retos para premiar a quie- 
nes desarrollen aplicaciones en todos los ambitos. En nuestro pais, 
buena parte de ese esfuerzo corre a cargo de Open Data Peru, una 
comunidad que ya es parte del movimiento internacional de datos 
abiertos y celebra cada marzo el Open Data Day. 

Para el Consejo de la Prensa Peruana ha sido una experiencia 
gratificante unir esfuerzos con OjoPublico en el Proyecto para la 
Promocion de Datos Abiertos en el Peru, a traves de actividades que 
fueron auspiciadas por la Fundacion HIVOS y que incluyeron, por 
ejemplo, la organizacion del seminario “Periodismo de datos abier- 
tos: la agenda pendiente de la prensa peruana”, en agosto del 2015. 

No dudamos de que “La navaja suiza del reportero” se convertira 
en una herramienta de consulta para los periodistas que procuren 
encontrar antecedentes exitosos, ideas sugerentes y metodos efica- 
ces para investigar historias relevantes e insospechadas a partir de 
las bases de datos. 

Por ello extendemos nuestro sincero agradecimiento a la Funda- 
cion HIVOS y a IDEA Internacional, que se sumo a la iniciativa e hizo 
posible la estupenda edicion que hoy presentamos. 


Para nuestra institution, este esfuerzo coincide con un nuevo 
ambito de actividades que iniciamos en el 2015 y seguiremos de- 
sarrollando en los proximos afios: se trata del proyecto Escuela de 
Periodismo de Datos, cuyo objetivo es capacitar a periodistas perua- 
nos en el uso de nuevas tecnologias y fuentes de informacion para 
enriquecer su trabajo y el impacto del mismo en la sociedad. Es una 
iniciativa que cuenta con el impulso de IBM, OjoPublico, Open Data 
Peru y el Consejo de la Prensa Peruana. Estamos seguros de que 
este esfuerzo tendra grandes y edificantes frutos. 


Kela Leon Amezaga 
Directora Ejecutiva 
Consejo de la Prensa Peruana 
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C uando ya se habia convertido en el hombre mas buscado 
del planeta, el analista estadounidense Edward Snowden 
se sento junto a un par de periodistas y grabo con voz 
tranquila una frase que podria ser un salmo del future. “La tecnolo- 
gia es el mas grande ecualizador de la historia humana”. 1 A1 momen- 
ta en que lo dijo, estaba oculto en la habitation de un hotel de Moscu, 
a riesgo de ser capturado por haber revelado la mayor maquinaria 
de vigilancia clandestina que haya existido jamas. En lugar de un 
pedido de ayuda, era un mensaje sobre el verdadero sentido de la re- 
volution digital. “Nos ayuda a adoptar nuevos rostros, entrar en nue- 
vas comunidades, participar en nuevas conversaciones y descubrir 
quienes somos y en que nos queremos convertir”. Snowden procla- 
maba una lucha contra los poderes que pretenden usar la tecnologla 
para decir si somos buenas o malas personas. “No son los gobiernos 
quienes deben decidirlo. Somos nosotros”. Su modo de contribuir a 
esa lucha fue convertirse en la mayor fuente periodistica de todos 
los tiempos. 

Snowden es el arquetipo de esta era de informantes globales. 
Cuando salio a la luz, el soldado Bradley Manning ya estaba preso 
por haber filtrado una gran cantidad de secretos y Julian Assange 
estaba asilado en la embajada de Ecuador en Londres. A diferencia 
de Manning, que dejo un reguero de pistas personales antes de la fil- 
tration, y de Assange, que hizo del activismo un culto a la personali- 
dad, Snowden solo hizo su primer movimiento despues de un calculo 
al milimetro que le permitio aparecer de la nada y hacer plantea- 
mientos con cierto aire visionario, muy bien estructurado, sobre las 
repercusiones de su filtration ya no para la sociedad estadounidense, 
sino para cada individuo en el planeta. El eje de esa estrategia era 
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1 PLATON. “The Most Wanted Man in the World: Edward Snowden in His Own Words - WIRED”. Video. En: 
https://www.youtube.com/watch?v=LgA7DoptXgO [Visualizado: 21 de noviembre de 2015] 


asegurarse la intervention de Glenn Greenwald, un periodista cono- 
cido por sus antecedentes como abogado de derechos humanos y por 
su cobertura del espionaje masivo cometido por la NSA, la agenda de 
inteligencia especializada en el recojo de information y analisis de 
datos. El contacto entre ambos es una prueba a escala de los desafios 
del periodismo para entender y registrar hechos de interes publico 
en la sociedad digital de este tiempo. El informante mas famoso des- 
de Garganta Profunda no solo filtro secretos al periodista. Tuvo que 
alfabetizarlo en recursos tecnicos antes de ponerse a trabajar. 

El primer contacto se produjo en diciembre del 2012. Snowden 
envio a Greenwald un e-mail con seudonimo que empezaba con una 
defensa de la seguridad de las comunicaciones entre las personas. 
Siempre desde el anonimato, el autor del mensaje explicaba al in- 
vestigador que utilizar una cuenta normal de correo ponia en peli- 
gro a la gente que quisiera transmitirle information sensible. No era 
una sorpresa, las historias sobre el espionaje a traves de Internet 
hablan generado titulares durante casi toda la primera decada del 
siglo XXI y en los ultimos anos se hablan concentrado en el papel de 
los gigantes de la comunicacion en linea para facilitar la vigilancia 
gubernamental en palses de poca tradition democratica como China 
o Siria. La fuente misteriosa sugeria que el periodista se instalara un 
programa de encriptacion, un software que permite codificar desde 
las contrasenas hasta los mensajes para hasta hacer imposible que 
una tercera persona, agenda o gobierno, interceptara sus comuni- 
caciones. Incluso se ofrecla a darle una mano si le resultaba diflcil. 
“Hacia tiempo que yo queria usar software de encriptacion”, escribe 
Greenwald en el libro Sin lugar donde esconderse, que cuenta de- 
talles de la investigation. “Sin embargo, el programa es complicado, 
sobre todo para alguien como yo, poco ducho en programacion y or- 
denadores. Era una de estas cosas para las que nunca encuentras el 
momento”. 2 


“Las computadoras no 
hacen bueno a un mal 
reportero. Lo que hacen 
es convertir a un buen 
reportero en uno mejor”. 


Elliot Jaspin, Premio Pulitzer 1979 
de Periodismo de Investigacion 


2 GREENWALD, Glenn. “Sin lugar donde esconderse. Edward Snowden, la NSA y el estado de vigilancia de 
EE.UU.". Barcelona: Ediciones B, 2014. 


Tor Project 


CAJA DE 
SEGURIDAD 


[Herramientas para 
evitar que te espien 
en Internet] 


https://www.torproject.org/ 


Software gratuito para comunicaciones seguras. Oculta 
la direction de IP de los dispositivos utilizados. Permite 
navegar sin ser detectado ni dejar rastro de sitios visitados 
o la ubicacion geografica del usuario. 


Cryptocat 


https://crypto.cat/ 


Servicio de mensajena instantanea privada en la web que 
puede ser usado desde cualquier navegador y en celulares. 


Mozilla Thunderbird 

https://www.mozilla.org/en-US/thunderbird/ 


Programa de correo libre y de codigo seguro para recibir, 
enviar y almacenar mensajes electronicos. Se puede 
gestionar varias cuentas de correo con un solo programa. 


Enigmail 


Complemento del Thunderbird que permite enviar correos 
protegidos con claves cifradas. El usuario mantiene su 
clave. Para usar Enigmail, se debe instalar tambien GNU 
Privacy Guard (GnuPG). 



01 

010 

10 


El programa al que se referia Greenwald se llama PGP, siglas en 
ingles de Pretty Good Privacy (Seguridad Muy Buena). Es una he- 
rramienta popular entre hackers y toda clase de gente que vive en 
riesgo de ser espiado. Funciona con una clave especial que uno debe 
intercambiar con el remitente para establecer un contacto seguro. 
“En esencia, el programa envuelve los e-mails con un escudo protec- 
tor que es una contrasena compuesta por centenares, incluso miles 
de numeros aleatorios y letras sensibles a las mayusculas”, cuenta 
Greenwald en su libro. Incluso los programas de desciframiento mas 
avanzados de las agendas de inteligencia mas poderosas tardarian 
anos en vulnerar esa protection. Aunque Greenwald conocia sus be- 
neficios al haber escrito sobre casos como el de Wikileaks o Anony- 
mous, no lo habia incorporado a sus herramientas ni estaba dispues- 
to a dedicarle tiempo. 

Dias despues, el remitente anonimo volvio a escribirle con una 
serie de instrucciones para instalar el programa. Incluso le ofre- 
cio contactarlo con algun experto para que le ayudara a empezar. 
Greenwald ofrecio hacerlo, pero tampoco movio un dedo. Tenia 
mucha carga de trabajo y nada le garantizaba que hacer el esfuerzo 
trajera a cambio una gran historia. Semanas despues, el persona- 
je desconocido insistio en facilitarte las cosas con un video tutorial 
que llevaba por titulo: “PGP para periodistas”. Ni siquiera por eso, 
Greenwald se puso en action. Tampoco lo haria en los dos meses 
siguientes. Para entonces, el informante habia buscado otra via para 
seguir con sus planes: busco a la documentalista Laura Poitras por 
la sencilla razon de que ella si usaba programas de encriptacion. Fue 
Poitras quien supo por primera vez las dimensiones de la fuente y 
sus secretos. “Asi de cerca estuve de perder las Lltraciones mas im- 
portantes y trascendentales para la seguridad national en la historia 
de Estados Unidos”, reconoceria Greenwald. Su suerte estuvo en que 
Snowden insistio en trabajar con el. 

Tiempo despues, tras una serie de medidas de seguridad que in- 
cluyeron crear nuevos e-mails encriptados, mas claves y la ayuda 
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datos habra en el universo 




digital en el 2020, segun 
proyecciones de la 
consultora tecnologica 
IDC. 




de un experto en seguridad informatica como intermediario, la pro- 
pia Laura Poitras encargo a este tecnologo aliado que le ensenara a 
Greenwald un sistema todavia menos conocido llamado Tails (siglas 
de The Amnesic Incognito Live System ), que solo se usa desde un 
dispositivo portatil. 3 El experto preparo una version especial para el 
reportero en un USB azul y se lo envio por correo hasta Brasil. Es el 
accesorio que aparece conectado a la computadora de Greenwald 
mientras entrevista a Snowden en una habitation de Hong Kong 
para el documental Citizenfour. Asi comenzo la historia. En su 
actual perbl de Twitter, Glenn Greenwald senala que tiene dis- 
ponible su Have publica de PGP y su respectiva huella digital, un 
numero mas corto, de apenas 40 digitos, que facilita la conbrmacion 
de la Have. Tambien es una huella del aprendizaje que represento 
su encuentro con Snowden en un fragmento de la historia en que la 
tecnologia ya no es un accesorio, sino parte del habitat en que trans- 
curre la experiencia humana. 

Desde la hltracion mas impactante del siglo, existe la idea de que 
un dia los periodistas tendremos que imitar a los astronomos para 
capturar certezas en el expansivo universo digital. No todos vamos 
a escribir sobre el espionaje de los servicios secretos occidentales ni 
sobre los planes de ciertos gobiernos para capturar Internet -aunque 
deberiamos tenerlo en agenda-, pero tan valioso como eso es tener 
los instrumentos para entender esta era de los datos. Incluso antes de 
los atentados del 11 de septiembre, ya se sabia que la mayor agenda 
de inteligencia estadounidense estaba interceptando 1.700 millones 
de comunicaciones en un dia. Con las revelaciones de Snowden se 
supo que en el 2013 la misma agenda alcanzo a capturar un billon de 
metadatos que permiten desde saber que busca la gente en Internet, 
cuales son sus aficiones e incluso cual sera su comportamiento en 
el futuro inmediato. Ese mismo ano, un catedratico estadounidense 


3 LEE, Micah. “Ed Snowden taught me to smuggle secrets past incredible danger. Now I teach you”. The 
Intercept. En: https://theintercept.com/2014/10/28/smuggling-snowden-secrets/ [Visualizado: 22 de 
noviembre de 2015] 


calculo que el volumen de information almacenado en el mundo era 
de 1.200 exabytes, equivalente a cubrir de libros toda la superficie de 
Estados Unidos unas cincuenta y dos veces. 4 Casi no hay proceso que 
no pueda ser cuantificado. <j,C6mo entender una cantidad de datos 
que, puestos en CD, darla para formar una torre hasta la Luna? 

En esencia, se requiere un cambio en las capacidades tecnicas 
y en el pensamiento operational del periodista de investigation. La 
clasica metafora del oficio tendria que cambiar de tener una caja 
de herramientas a manejar un equipo de laboratorio. “Los periodis- 
tas no necesitan aprender a programar, pero si necesitan desarrollar 
mentalidad de datos masivos, de manera en que entiendan que los 
datos contienen historias que pueden quedar sin ser contadas”, dice 
el experto en Internet y catedratico de Oxford Viktor Schonberger. 5 
En la anterior gran revolution del periodismo -el llamado Nuevo 
Periodismo- se hablaba de las escenas, el dialogo y la perspectiva 
como las tecnicas experimentales que habian cambiado la forma 
de contar buenas historias. La nueva artesania incluye dominar 
suficientes conceptos para pensar en una redaction periodistica 
como un taller de robotica: encriptar, scrapear, refinar, visuali- 

i 

zar. Un metalenguaje para definir como manejamos los datos. 

No son las aplicaciones ni el software los que definen el nuevo 
momento del periodismo, sino la posibilidad que nos ofrecen de en- 
contrar respuestas a preguntas que antes parecian de ciencia fiction. 
“Los datos pueden revelar secretos a quienes tengan la humildad, el 
deseo y las herramientas para escuchar”, escribio Viktor Schonber- 
ger junto a Kenneth Cukier en el libro Big data, la revolucion de 
los datos masivos. Tambien en eso nos parecemos a los astronomos: 
nos enfrentamos a un universo tan grande que exige mejorar nues- 
tros instrumentos de un dia para el otro. 



44 % 



de los datos en el universo 
digital requiere algun tipo de 
protection, desde medidas 
de seguridad hasta 
criptografia, segun IDC. 



4 SCHONBERGER, Viktor y Kenneth CUKIER. “Big data, la revolucion de los datos masivos". Madrid: Turner, 
2013. 

5 GONZALO, Marilin. “Los datos masivos (o big data) son el nuevo oro”. En eldiario.es (Espaiia), 5 de agosto 
del 2013. En: http://www.eldiario.es/turing/Big-data_0_161334397.html [Visualizado: 22 de noviembre de 
2015] 


“Necesitamos humanizar 
y personalizar los 
grandes datasets en una 
forma que no desvirtue la 
complejidad o la escala de 
los temas que se trata”. 


Paul Bradshaw, autor del Online 
Journalism Blog. 


BIG (REALLY BIG) DATA 

A initios del siglo XXI, el economista estadounidense Steven Le- 
vitt imagino una economia de lo raro. Se trataba de encontrar ver- 
dades sorprendentes a partir de la forma en que se analizaban los 
datos. Levitt lo hizo llevando al extremo la logica de hacer pregun- 
tas: ^Por que continuan viviendo los traficantes de drogas con sus 
madres? o <;que resulta mas peligroso, una pistola o una piscina? En 
uno de sus ensayos planted a sus lectores el caso de una pareja que 
evita enviar a su hija a casa de una vecina cuyo padre guarda una 
pistola en casa, pero la deja ir donde otra que vive en una casa con 
piscina en el patio. La pregunta fue cual decision era la correcta para 
la seguridad de la nina. Levitt encontro que de acuerdo a las esta- 
dlsticas, hay una muerte infantil por cada 11 mil piscinas, lo que en 
un pais con 6 millones de piscinas supone una media de 550 ninos 
ahogados al ano. En cambio, un nino muere de un disparo por cada 
millon y medio de armas. En un pais con 200 millones de armas, la 
proportion de 175 ninos muertos de un disparo al ano. Traduction: 
una nina tiene estadisticamente mas probabilidades de morir en una 
piscina que jugando con el arma del papa de su vecina. Si el ser hu- 
mano suele modificar sus comportamientos con muestras a escala, 
^que pasa cuando la information desborda nuestra capacidad de al- 
macenarla? “La era de los datos masivos pone en cuestion la forma en 
que vivimos e interactuamos con el mundo”, explican Schonberger 
y Cukier. 

Su caso predilecto fue cuando el buscador mas famoso del mundo 
salvo a Estados Unidos de una epidemia global. Cuando la gripe aviar 
llego a ese pais, los sistemas de salud colapsaron ante la falta de in- 
formation oportuna para plantear estrategias. El sistema de alertas 
era demasiado lento para entender la propagation de la enfermedad. 
Por esos dias, la revista cientifica Nature publico un articulo en que 
ingenieros de Google demostraban haber encontrado la manera de 
predecir la propagation de la gripe comun. El metodo consistia en 
combinar las tendencias de busqueda acerca de los sintomas con in- 


LA NAVAJA SUIZA 
DEL REPORTERO 


El recojo Depuracion 

de los datos y contexto 


GUIA 

PARA 

INVESTIGAR 
CON DATOS 

El periodista Paul 
Bradshaw, autor del 
Online Journalism 
Blog, plantea que el 
trabajo periodistico 
con bases de datos 
comprende cinco etapas: 
recojo, depuracion, 
analisis, verificacion 
y presentacion de 
hallazgos. Podemos 
tomar esa secuencia para 
plantear el siguiente 
ejercicio a la bora de 
iniciar un proyecto. 


O Debes conocer los formatos 
de los archivos que contienen 
la infoimacion y las herra- 
mientas para recopilarlos. Se 
puede obtener datos masi- 
vos mediante un script, un 
programa simple que permite 
bajar informacion de manera 
automatizada. A este proceso 
se le conoce como scraping. 


^Hay bases de datos sobre 
el tema? ^Como y para 
que fueron hechas? ^Estan 
en una web oficial o debo 
hacer un pedido de acceso a 
la informacion? 



Si la base esta en una web, 
^es descargable o debo 
hacer scraping? 


^Cual es el mejor forma- 
to (Excel, CSV, Json) para 
solicitar una copia de esas 
bases de datos? Si la infor- 
macion esta en PDF o JPG, 
icomo la paso a un Excel? 


Si debo construir una nueva 
base, ique variables debo 
incluir y que podre demos- 
trar? 



Puede haber errores de varios 
tipos: registros duplicados, 
casillas incompletas, palabras 
mal escritas, etc. Necesitas 
herramientas para identificar 
y resolver esos problemas. 

A esto se le llama limpiar la 
data. 


i 


^La base de datos esta com- 
pleta? ,/Cuantas lineas de 
informacion tiene? ^Puedo 
limpiarla con Excel u Open 
Refine? ^En que casos debo 
hacerlo a mano? ^En que 
caso debo usar gestores 
con mas capacidad, como 
MongoDB? 


iConozco y entiendo todos 
los terminos, variables y 
siglas que aparecen en las 
bases? ^Son los mismos que 
los usados en bases simila- 
res? iLos criterios apuntan 
al sentido de la pregunta 
que quiero responder o 
necesito ver esos mismos 
datos en sentido inverso? 


Cruce y analisis 


Verificacion 


Presentacion 


En esta fase, el valor de sus 
hallazgos depende de la 
calidad de las preguntas y 
de la combinacion de dos o 
mas registros para encontrar 
coincidencias reveladoras. 

^Tienen mis bases de 
datos un concepto o codigo 
comun que me permita cru- 
zarlas: DNI, RUC, nombres 
completos? 

<jEl cruce de las bases de 
datos muestra tendencias, 
patrones, procesos evoluti- 
vos en un periodo determi- 
nado? ,/En que contexto? 

0, por el contrario, ^revela 
comportamientos atipicos? 
,-En que contexto? 




El periodista de investigation 
debe aplicar la metodologia 
tradicional: ir a los lugares 
necesarios, entrevistar a las 
personas involucradas, revi- 
sar nuevos documentos para 
detectar las debilidades y 
fortalezas de la base de datos. 


^Reflejan los datos la con- 
dicion real de las personas? 
^Ha variado algo en la vida 
del aludido, en su salud, es- 
tabilidad economica, situa- 
tion legal o sus vinculos? 


^Influye eso en el sentido 
del hallazgo? ,/Confirma su 
relevancia, la acentua o la 
relativiza? 


,/Con que experto puedo 
validar la metodologia del 
cruce? ^Es posible que el 
hallazgo sea correcto, pero 
admita mas de una inter- 
pretation? 



Hay que pensar desde el ini- 
cio en la forma mas eficiente 
de presentar los hallazgos. 
Existen librerias como d3js. 
org y repositories de software 
como Github, con ejemplos 
que uno puede adaptar a lo 
que necesita. 



^Conviene mas una visua- 
lization o una aplicacion? 
iCual aporta al sentido de 
la historia? 


iComo debe ser la experien- 
ce del usuario? ^Que es lo 
que el grafico o la herra- 
mienta debe generar en 
el lector? ^Que elementos 
de mi aplicacion o visuali- 
zation la hacen necesaria 
para el usuario? 

<jEs responsiva? ^Se vera 
bien en telefonos moviles y 
tablets? ^Se puede compar- 
tir? ,/Se puede embeber? 



OPEN REFINE, 

UN SOFTWARE 
CON ESTEROIDES 

[Como detector 
errores entre 
millones de datos] 


Todo el que trabaje con hojas de calculo sabe que existen 
cuatro problemas comunes: faltas ortograficas, nombres 
o palabras escritas de varias formas, caracteres invisibles o 
espacios en bianco. No parecen complicados para quien use 
un archivo de Excel personal, pero son una pesadilla a la bora 
manejar bases de datos con millones de lineas. En estos casos, 
lo mas util es trabajar con Open Refine, una herramienta 
de codigo abierto que permite depurar y organizar datos 
en pocos pasos. Tomemos como muestra un registro de 
empresas exportadoras de oro. Es posible que el nombre de 
una compama haya sido llenado de varias formas (OrogoldSA, 
OrogoldSA y OroGold). Un analisis inicial las contabilizara 
como empresas diferentes. Open Refine encuentra las 
coincidencias y permite editarlas con una sola accion 
para darles uniformidad. 


Ademas, si se comete algun error al editar la base de 
datos, es posible volver al estado anterior con la opcion 
que muestra el historial de cambios realizados. 

Este programa se puede descargar de http://openrefine.org/ 
download.html, es compatible con cualquier navegador y esta 
disponible para Windows, Mac y Linux. Ademas permite 
transformar archivos de diferentes extensiones como XLS, 

CSV, JSON, XML, TSV y las spreadsheets de Google. 

Es un recurso muy necesario en la caja de herramientas 
del reportero de investigacion. Algunos periodistas suelen 
defmirlo como “la version de Excel con esteroides”. 



formacion historica sobre la evolucion de la enfermedad. “Otros ya 
habian intentado hacer esto con los terminos de busqueda de Inter- 
net, pero nadie disponia de tantos datos, capacidad de procesarlos 
y know-how estadistico como Google”, escriben los expertos. Tan 
solo validar las palabras o frases clave supuso recrear 450 millones 
de modelos matematicos diferentes. El resultado fue un grupo de 
45 terminos que mostraban la relacion entre las busquedas de los 
posibles pacientes y la evolucion de la gripe. El detalle es que, a 
| diferencia del modo tradicional, que podia tomar semanas para 
recuperar la informacion, Google elaboro un software que lograba 
esa precision en tiempo real. 

iQue podemos aprender los periodistas de este tiempo en que 
un algoritmo puede predecir el momento en que millones de per- 
sonas se limpiaran la nariz? “Los big data -los datos masivos- se 
refieren a cosas que se pueden hacer a gran escala [. . .] para extraer 
nuevas percepciones o crear nuevas formas de valor, de tal manera 
que transforman los mercados, las organizaciones, las relaciones en- 
tre los ciudadanos y los gobiernos”, senalan Schonberger y Cukier. 
Desde que el psiquiatra Carl Jung descifro como suehan los seres 
humanos ninguna operation para encontrar historias en el mundo 
abstracto fue tan poderosa. 

“Los datos son sagrados”, dice un viejo lema del diario ingles The 
Guardian. Ahora es el principio que guia el trabajo de su antiguo 
editor digital Simon Rogers el periodista que convirtio la estadistica 
en un cuadro de Mondrian. “La mayor parte del tiempo actuamos 
como el puente entre los datos (y aquellos que estan desesperados 
en explicarlos) y la gente del mundo real que trata de entender de 
que va realmente una historia”, dice Rogers en Facts are sacred , 
una guia de como convertir datos en conceptos visuales. En el 2011, 
el equipo liderado por Rogers -quien ahora dirige el laboratorio di- 
gital de Google- explico el aparato administrativo civil de Inglate- 
rra como si fuera un racimo de globos de colores. De un vistazo, los 
lectores pudieron entender una estructura burocratica que original- 



300 



mil registros de 
compahias inscritas en 
Panama fueron descargados 
por el programador Dan 
O’Huiginn para crear un 
sitio que facilita las 
busquedas. 


LA NAVAJA SUIZA 
DEL REPORTERO 



OpenCorporates 


DIEZ BASES 
DE DATOS 
PARA 


<p https://opencorporates.com/ 
Contiene informacion sobre 80 
millones de companias y 90 mi- 
llones de directores en mas de 
100 paises. Se puede buscar por 
nombre de empresa, direccion y 
nombres de los directores. 


RASTREAR 


EL DINERO 


Y OTRAS 


PISTAS 

Una sugerente seleccion recogida por OjoPublico 
entre los asistentes a la Conferencia Global de 
Periodismo de Investigacion 2015. 


ICIJ Offshore Leaks Database 

(P http://offshoreleaks.icij.org/search 

Tiene datos de mas de 100 mil companias y fondos guardados en 
paraisos fiscales. Es parte de un archivo de 2,5 millones de do- 
cumentos filtrados al Consorcio Internacional de Periodistas de 
Investigacion (ICIJ). 


Personas 
de interes 



(p https://www.personadeinteres.org 

Da acceso a archivos judiciales, 
registros de propiedades e infor- 
mes de inteligencia sobre gente 
vinculada al crimen organizado, 
narcotrafico, corrupcion, etc. 

Tiene informacion sobre proce- 
sados por narcotrafico en Peru. 


Open Spending 


Search Systems 


(p https://openspending.org/ 
Sitio web que sigue el gasto 
publico de los gobiernos en 
todo el mundo y lo presenta 
en distintas formas de visua- 
lization. 


Registro de 
propiedades de 
Miami 


(p http:// www.miamidade.gov 
Base de datos libre del Conda- 
do de Miami Dade, que per- 
mite localizar propiedades en 
Miami, por nombre del dueno. 


(p http://publicrecords.searchsystems.net 

Portal especializado en la busqueda de personas. Contiene mas de 
55 mil bases de datos organizadas por fecha de nacimiento, fecha 
de defuncion, matrimonio, licencias, acciones, hipotecas, entre otras 
subdivisiones. 



Registro de 
companias de 
Panama 


(p http://ohuiginn.net/panama/ 
Sitio independiente que 
reordeno la data del registro 
publico de Panama para facili- 
tar la investigacion sobre mas 
de 300 mil empresas inscritas 
en este pais. Permite hacer 
busquedas por nombre de 
personas. 


Investigative Dashboard 


https://www.investigativedashboard.org/ 

Permite buscar informacion de los accionistas, directores y los repor- 
tes financieros de companias alrededor del mundo. Hay enlaces a mas 
de 450 bases de datos en linea de 120 paises. Plataforma construida 
por el Organized Crime and Corruption Reporting Project (Occrp). 


FlightAware 


(P https://es.flightaware.com/ 

Es una plataforma para ras- 
trear los vuelos y su estado 
en todo el mundo. Ofrece una 
aplicacion descargable en el 
celular. Permite buscar por el 
nombre de la linea aerea, el 
numero de vuelo, la ruta y la 
matricula de la aeronave. 


Marine traffic 

<p http://www.marinetraffic.com/ 
Es una base de datos actua- 
lizada en tiempo real que 
permite rastrear la localiza- 
tion de cualquier tipo de barco 
o navio, ademas de las salidas, 
llegadas y recorridos. 





mente era una lista con mas de 200 mil nombres, sus posiciones y su 
salario. El analisis permitio saber que al menos 90 burocratas gana- 
ban mas que el Primer Ministro ingles. 

En otra ocasion, los periodistas David Leigh y Nick Davies, del 
equipo de investigacion de The Guardian , obtuvieron de Wikileaks 
un archivo con informacion detallada acerca de todos los inciden- 
tes militares registrados por el ejercito estadounidense durante la 
guerra en Afganistan. La habian creado soldados encargados de mo- 
nitorear las acciones. El primer paso fue recibir la informacion en- 
criptada por e-mail. El problema fue revisar los datos y encontrar la 
historia: el archivo contenia una hoja de calculo con 91 mil 201 filas. 
Era un volumen demasiado abrumador para ser analizado por los pe- 
riodistas y hasta los expertos en sistemas del periodico encontraban 
dificultades para manejarlo. “Es como encontrar pequenas pepitas 
de oro en medio de una montana de datos”, llego a decir Leigh. 6 

Para ese momento, el diario tenia experiencia con grandes ba- 
ses de datos liberadas por el gobierno e incluso habia creado ex- 
ploradores internos que permitian a los periodistas hacer bus- 
quedas. Esta vez volvieron a hacerlo. Los datos fueron filtrados 
de acuerdo a un orden que incluia fecha, hora, description de los 
ataques, numero de victimas y las coordenadas donde habian ocu- 
rrido. El analisis permitio establecer que el numero de ataques con 
artefactos caseros -los mas impredecibles y letales- habian aumen- 
tado, y que ese aumento se habia producido justamente en las zonas 
controladas por los ejercitos de Reino Unido y Canada. Ahora el reto 
era encontrar la mejor manera de contar esa historia. Fue enton- 
ces que un equipo de visualizadores, encabezado por Simon Rogers, 
se incorporo al trabajo. “El proyecto Wikileaks estaba produciendo 
nuevos tipos de datos, asi que necesitaban ser extraidos con nuevos 
tipos de periodismo”, escribio Leigh junto a Luke Harding, otro de 
los reporteros que participo en la investigacion. 7 El resultado fue 



ciudades del mundo 
tienen comunidades 


Hacks/Hackers, que 
facilitan la colaboracion 
entre periodistas y 
programadores. 



6 LEIGH, David y Luke HARDING. "Wikileaks y Assange”. Barcelona: Ediciones Deusto, 2011. 

7 Op. cit. 


“Nunca comienzo un 
proceso si no desarrollo 
un plan. Utilizo una 
matriz propia, que 
nos ayuda a apuntar a 
preguntas concretas”. 


Ginna Morelo, Editora de Datos de 
El Tiempo (Colombia) 


un mapa que mostraba por primera vez la evolution de seis anos de 
atentados en ese pais: entonces se confirmo que la racha sangrienta 
habia dejado mas muertos civiles que militares. 8 

“La historia de Wikileaks es una combination de las dos cosas: los 
conocimientos del periodismo traditional y el poder de la tecnologia, 
unidos para contar una historia alucinante”, escribio la dupla que 
reconstruyo el caso. 

Aun con estas muestras del potential de los datos, hasta hace 
muy poco muchos periodistas, incluso los de investigacion, tendian 
a pensar que la tecnologia era un idioma extraterrestre. La sola idea 
de indagar en un archivo de Excel con mas de mil filas desanimaba 
al traditional cazador de documentos confidenciales. “No tienes que 
ser un programador”, precisa Rogers en su libro. “Puedes convertirte 
en codificador de lujo si asi lo quieres, pero la tarea principal es pen- 
sar en los datos como un periodista en vez de como un analista”. Nin- 
guna herramienta digital va a reemplazar el ejercicio de preguntar 
que informacion relevante pueden brindar los datos o que pasaria si 
uno mezcla una base con otra, a la manera del original economista 
de lo raro. Lo que uno no pueda hacer por su cuenta, puede hacerlo 
con aliados del universo paralelo. 


EL CODIGO DE LA FUERZA 

Era cuestion de tiempo que alguien inventara un espacio para 
integrar dos maneras de ver la informacion. La idea partio de una 
coincidencia entre un joven corresponsal y dos periodistas vetera- 
nos. Burt Herman era un reportero de la agenda Associated Press 
que llevaba doce anos viajando por zona sensibles del mundo, desde 
Corea y algunos paises de la ex Union Sovietica hasta los convul- 
sionados Irak y Afganistan. Entre el 2008 y el 2009, Herman dejo la 
agenda y opto por una beca para explorar innovaciones periodisti- 
cas en la Universidad de Stanford. Desde alii, en la voragine digital 
de Silicon Valley, empezo a organizar reuniones de gente interesada 


8 ROGERS, Simon. “Facts are sacred”. Londres: Faber and Faber Limited, 2013. 


en el periodismo y la tecnologia. Por esa misma epoca, Aron Pil- 
hofer, editor del The New York Times , y Rich Gordon, profesor de 
la Northwestern University, lanzaron desde Massachusetts una con- 
vocatoria para formar una red que desarrollara aplicaciones y he- 
rramientas digitales para procesar information. Ambas iniciativas 
coincidian en un concepto: unir a los hacks, un termino que alude a 
la capacidad de los periodistas para producir textos en serie, con los 
hackers, que son prolificos escritores de codigo fuente, el conjunto 
de instrucciones que hace funcionar las maquinas. 9 

Semejante cruce de lenguajes daria para un episodio de Star 
Wars: es como si dos razas alienigenas -una respecto de la otra, al 
menos- hubieran llegado a un acuerdo para cumplir una mision. El 
unico modo posible es intercambiar conocimientos: los periodistas 
aprenden de los hackers la jerga y principios que rigen el ciberespa- 
cio y a cambio los entrenan para usar sus habilidades con el fin de 
dar sentido a la information. La prueba esta en la experiencia del 
propio Burt Herman. Mientras realizaba su beca, entro en contacto 
con el programador belga Xavier Damman y juntos se propusieron 
crear una herramienta que aprovechara el potential informativo de 
las redes sociales. El resultado fue Storify, una aplicacion que per- 
mite reunir fotos, videos, tuits y links para contar una historia que 
puede ser insertada en cualquier sitio web. “La manera de dar sen- 
tido a los medios de comunicacion social es a traves de la curaduria 
humana con la ayuda de la tecnologia”, ha dicho Herman. 

Esta alianza ya esta generando cambios en el periodismo global: 
la comunidad HacksHackers tiene capitulos en ciudades de todos los 
continentes. En cada lugar ha facilitado la creation de herramientas 
que permiten procesar grandes cantidades de information. A initios 
del 2014, por ejemplo, el capitulo de Rosario, en Argentina, reunio 
datos del ministerio de Justicia, reportes policiales y articulos de 
prensa y construyo un mapa interactive en que uno puede ver el 


“Cuando diseno una hoja 
de calculo para una nota 
pienso en las metas: que 
quiero saber y cuales son 
los posibles patrones en 
los datos”. 


Lise Olsen, reportera de 
investigation del Houston Chronicle. 


9 HIDALGO, David. “Periodistas buscan hackers (de los buenos)”. En: http://hhlima.info/node/8 [Visualizado: 
25 de noviembre de 2015] 


Fondos de Papel 


CATALOGO 
EN LINEA 


[Aplicaciones 
periodisticas 
desarrolladas 
por OjoPublico] 






http://fondosdepapel.ojo-publico.com/ 


Reportaje interactive que ofrece una radiografia inedita 
sobre el financiamiento privado de los partidos politicos 
del Peru y sus candidatos presidenciales en las campanas 
del 2006, 2011 y 2016. 

Billeton electoral 


http://ojo-publico.com/sites/apps/billeton-electoral/ 


Aplicacion que permite evidenciar la desigualdad 
economica al comparar los ingresos de los usuarios con los 
de los principales candidatos presidenciales peruanos en 
las elecciones del 2016. 

Congreso Airlines 


http://ojo-publico.com/sites/apps/congreso-airlines/ 


Aplicacion que muestra los viajes internacionales de 113 
congresistas del Peru y los gastos que realizo el Poder 
Legislative para cubrirlos entre el 2011 y 2015. 

Cuentas Juradas 


http://cuentasjuradas.ojo-publico.com/ 


Plataforma que muestra la evolution del patrimonio 
declarado entre el 2003 y 2014 por 38 alcaldes de Lima 
que buscaban la reeleccion y de 23 exalcaldes que querian 
volver al poder en las elecciones municipales del 2014. 


punto exacto en que se produjo cada homicidio ocurrido el ano ante- 
rior. “El proposito del proyecto era crear una plataforma que permi- 
tiera demostrar, a traves de la visualization de datos, el incremento 
de la violencia social en la ciudad”, ha escrito Ezequiel Clerici, uno 
de los organizadores de esa comunidad. Tiempo atras, en el 2011, el 
capitulo de Buenos Aires creo una aplicacion que permitia seguir 
en tiempo real los resultados de las elecciones presidenciales: basta 
marcar en un mapa el lugar que a uno le interesa y obtiene el dato 
correspondiente. En cada caso se cumple el ultimo axioma de la era 
de la information: el problema no son los cambios en los metodos del 
periodista, sino que entendemos por hacer periodismo. 

Como es de esperarse en la epoca de los datos masivos, el poten- 
tial es enorme. En junio del 2014, varios capitulos de America Latina 
se unieron en una hackaton regional para generar herramientas que 
permitieran a los periodistas vigilar el uso de los fondos publicos. La 
actividad fue bautizada con la expresion que ha guiado siempre al 
mejor periodismo: “La ruta del dinero”. El capitulo de Lima reunio a 
mas de cincuenta miembros que se encerraron durante doce horas 
en el auditorio de un instituto dedicado a la ensenanza en tecnolo- 
gia. La jornada consistio en formar equipos mixtos, de periodistas y 
desarrolladores, para analizar information dura de distintas bases 
de datos y convertirla en noticia. En esencia, se trataba de buscar el 
lado sexy de una tabla de Excel. 

Al final de la tarde, la comunidad presento siete proyectos, que 
iban desde el analisis de como se invierten los fondos del Ministerio 
del Ambiente hasta un calculo del dinero destinado por el Estado 
a la Iglesia Catolica. Una de las herramientas mas interesantes era 
una aplicacion que permitia realizar busquedas en bases de datos 
y paginas especializadas para identificar vinculos de funcionarios 
con el crimen organizado y su posible relation con fondos publicos. 
Otra era una aplicacion que permitia sistematizar los datos sobre los 
principales proveedores del Estado y cuanto dinero han facturado 
al pais. De no haber sido por ese encuentro, que funciono como un 
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EL VOLUMEN 
DE LOS DATOS 
EN EL UNIVERSO 
DIGITAL 


1 Petabyte (1 PB) 

Toda la information 
que Google proceso 
en el 2010. 


1,2 Zettabyte (1,2 ZB) 

Cantidad total de information 
que habia en el universo 
digital en el 2010. 


Cinco Megabytes 

(5 MB) Todas las 
obras de William 
Shakespeare. 



Fuente: Informe sobre el universo digital de la Consultora IDC. 


taller para curiosos, la information seguirla sepultada en archivos 
inconexos. “Este grupo refine a todas estas personas: los que estan 
trabajando para ayudar a la gente a darle un sentido a su mundo”, 
dice una declaration en la pagina original de HacksHackers. 

LOS ALIADOS 

Una tarde de octubre de 2010, el ingeniero costarricense Rigo- 
berto Carvajal decidid renunciar a su trabajo en una corporation de 
desarrollo de software para enrolarse en el periodismo. Por medio de 
un amigo se habia enterado de que el diario La Nation buscaba a un 
programador para su Unidad de Investigation. Carvajal se presento 
por la curiosidad de saber como un tipo como el podia ser util para 
destapar secretos. Tras una primera entrevista, quedo convencido 
de que era el lugar correcto. “Estudie programacion porque me gusta 
mucho resolver problemas y desde el periodismo uno puede hacerlo 
con fines mas nobles que incrementar las ganancias de una empresa”, 
dice Carvajal, quien ahora es uno de los expertos en bases de datos 
del Consorcio International de Periodistas de Investigation (ICIJ). 10 

El proyecto para el que estaba convocado era un desaflo para 
un periodico latinoamericano en esa epoca: reunir todas las bases 
de datos publicas de su pais para analizarlas, obtener conocimien- 
to nuevo e historias relevantes por investigar. Los informaticos del 
equipo debian tener la misma audacia y pasion por la verdad que 
los periodistas. En la entrevista de trabajo, Carvajal comentd que en 
cierta ocasion logro ubicar el paradero de una persona de la que solo 
tenia el nombre, gracias a que se las ingenio para contactar personas 
que le dieron la informacion adecuada. Su primera prueba demostro 
que mantenia la habilidad. Cuando le pidieron detectar las propieda- 
des de Shakira en EE.UU., el programador busco el verdadero nom- 
bre de la cantante y en seguida lo rastreo en registros de propieda- 
des hasta lograr su objetivo. Con el tiempo, Rigoberto Carvajal -un 
fanatico de la ciencia fiction- se transformo en una suerte de Spock, 


10 Entrevista a Rigoberto Carvajal. 



organismos de America 
Latina encuestados por 
la OEA sufrieron intentos 
de robo de datos a 
traves del conocido 
phishing. 



el personaje entre humano y extraterrestre de Star Trek: un hibrido 
entre la computation y el periodismo. 

“Volver a lo que hacia antes en la programacion, para la parte 
comercial, seria como volver al lado oscuro de la fuerza”, dice en alu- 
sion a otra de sus peliculas favoritas. 

El mismo espiritu animo al britanico Dan O’Huiginn cuando se 
planted descargar todo el registro publico de Panama en el 2008 
para una investigation sobre traficantes de armas. Hasta ese mo- 
menta, la web oficial solo permitia busquedas en base de los nombres 
de las empresas. Eso representaba una limitation para el trabajo 
de los reporteros que seguian la pista de personajes sospechosos. 
O’Huiginn extrajo los datos de mas de 300 mil companias, ordeno 
la information, y la utilizo para crear un sitio que admitia las bus- 
quedas basadas en nombres de individuos. 11 El programador suele 
explicar que ese trabajo no tuvo nada que ver con la pirateria ilegal. 
Solo usd sus habilidades tecnicas para automatizar la recopilacion 
de datos. “No me importa que me llamen hacker en el sentido lite- 
ral”, dijo cuando los medios panamenos se sorprendieron de que un 
sujeto desconocido, desde un terminal en otro continente, lograra 
ese acceso. Su esencia, explico, es la de “una persona que disfruta 
explorando los detalles de los sistemas programables y como exten- 
der sus capacidades, a diferencia de la mayoria de los usuarios, que 
prefieren aprender solo el minimo necesario”. 12 

El sitio creado por Dan O’Huiginn, que recibe 2 mil visitas diarias, 
permitio a periodistas de investigation de muchos paises verificar si 
funcionarios bajo sospecha de enriquecimiento ilicito y corruption 
tenian propiedades registradas en secreto en Panama. Con esta he- 
rramienta, en el 2011 la reportera Khadija Ismayilova demostro que 
las hijas del presidente de Azerbaiyan, Ilham Aliyev, dirigian una 
compania de telecomunicaciones a traves de empresas off-shore. 


11 http://ohulginn.net/panama/ [Visualizado: 22 de noviembre de 2015] 

12 “El Registro Publico solicito que eliminara mi web". En Diario La Estrella (Panama), 6 de octubre de 2013. 
En: http://laestrella.com.pa/panama/nacional/registro-publico-solicito-eliminara/23502395. [Visualizado: 
22 de noviembre de 2015] 


RECURSOS 
DIGITALES 
PARA CAZAR 
HISTORIAS 

[Los utensilios de 
escritorio para 
el reportero de 
investigacion] 



ScraperWiki 

ttps://scraperwiki.com/ 


£ 


Plataforma online que permite descargar information de la 
web y agruparla de forma ordenada en una base de datos 
(Excel, CSV, etc.). Ofrece la posibilidad de que cualquier 
persona cree su propio script de acuerdo a sus intereses. 


DocumentCloud 


ttps://www.documentcloud.org/ 


i 

Plataforma para gestionar documentos. Extrae el texto de 
una imagen mediante software OCR. Permite resaltar datos, 
hacer anotaciones y organizarlas en links de facil acceso. 
Ayuda a buscar por temas, embeber documentos, y colocarlos 
en un catalogo publico. Se accede previa postulacion. 


Visual Investigative Scenarios (VIS) 


ttps ://vis. occrp.org/ 


Una herramienta de especial interes para los periodistas de 
investigacion. Permite establecer relaciones entre personas 
y organizaciones y adjuntar documentos que prueben esa 
relacion. 



Dicha corporacion tenia mas de un millon y medio de suscripto- 
res, cubria el 80 por ciento del territorio de ese pais y en aquel tiem- 
po era la unica proveedora de servicios 3G. El sitio tambien permitio 
identificar a las empresas off-shore del expresidente de Egipto, Hos- 
ni Mubarak, y ademas proporciono evidencia que permitio conectar a 
cinco personas con el asesinato del exgobernador de la provincia de 
Panama, Dario Fernandez. Todas fueron condenadas. 

Desde el 2010, el programador O’Huiginn decidio entregarse de 
lleno al trabajo con periodistas de investigacion. Ha sido becario del 
African Network of Centers for Investigative Reporting y colabo- 
rado con proyectos del Organized Crime and Corruption Repor- 
ting Project (OCCRP). Hoy vive en Alemania y trabaja en el proyecto 
Openoil, el primer mapa de datos abiertos sobre concesiones petrole- 
ras en 18 paises de Medio Oriente. 

“Si se hace bien, la gente tiene realmente mucho apetito por ver 
los datos”, dice Scott Klein, un referente del periodismo de investi- 
gacion con datos masivos. 13 “Es suficiente ver cuanta gente entiende 
-y le encantan- estadisticas deportivas increiblemente sofisticadas 
e impenetrables”. Si un lector promedio esta dispuesto a leer paginas 
deportivas que parecen reportes de la bolsa de valores, ^por que no 
encontraria la utilidad de una herramienta que examina el sistema 
de salud o la calidad del agua que se toma en su localidad? 

Klein es editor de Propublica, uno de los medios mas innova- 
dores de Estados Unidos. En el 2010 recibio la mision de montar un 
proyecto que parecia sacado de un laboratorio de Sillicon Valley: el 
departamento de aplicaciones de noticias. Se trataba de un equipo 
formado por reporteros y tecnologos que trabajaria de manera con- 
junta para hacer periodismo usando software. Uno de sus proyectos 
mas impactantes fue Dollars for Docs (Dolares para los doctores), 
que revelo pagos por 258 millones de dolares a medicos que promo- 
vian entre sus pacientes los productos de siete empresas farmaceu- 


13 Citado en HOWARD, Alexander B. “El arte y la ciencia del periodismo de datos”. Tow Center de Periodismo 
Digital (Traduction de La Nacion DATA). 


ticas. El equipo aprovecho una ley que obligaba a los laboratories a 
difundir la information sobre el dinero que dan a los medicos por 
comisiones, almuerzos y subvention para convenciones, entre otros 
conceptos. Todos los documentos habian sido publicados en los sitios 
web de las farmaceuticas, pero en formatos complicados de manejar. 
Los programadores de Propublica elaboraron un script -un peque- 
no software que automatiza procesos- para recoger toda esa infor- 
mation. Con ese material elaboraron una aplicacion que permite a 
cualquier persona en Estados Unidos buscar a su doctor y saber si ha 
recibido dinero de los laboratorios, cuanto y por que. 

Klein suele referirse a su equipo de cinco personas como “pro- 
gramadores periodistas que piensan como reporteros”. Quiere de- 
cir que tienen habilidades para manejar herramientas digitales, 
pero a la vez tienen el instinto para detectar una buena historia 
en una montana de datos. “Algunos han dicho que los periodistas 
con habilidades para desarrollar software, o viceversa, son unicor- 
nios, raros de encontrar. Eso no es verdad, usted puede desarrollar 
en ellos las habilidades de periodismo e ingenieria que se requieren 
hoy en dia”, precisa. 14 El potencial es mayor al de solo hacer una vi- 
sualization, que permite contar una historia en un grafico, e incluso 
que una aplicacion, que permite contar varias historias y que el lector 
haga sus propios hallazgos. Es la posibilidad de unir dos metodologias 
rigurosas y afines que expandan las fronteras del conocimiento. “El 
periodismo de investigation es el departamento de estudio y desarro- 
llo de la profesion”, escribio Brant Houston, cofundador de la Global 
Investigative Journalism Network} 5 

Quiza la imagen que mejor refleja este momenta ha sido la plan- 
teada por Evan Smith, cofundador del Texas Tribune. Smith dice 
que el periodista de hoy debe ser como una navaja suiza. 16 La idea 
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periodistas de 26 
paises participaron en 
la investigation de los 
Luxembourg Leaks que 
revelo acuerdos ilegales 
en beneficio de 340 


corporaciones. 


14 FALLAS, Hassell. “Simpltficar es clave para crear aplicaciones de noticias”. Blog La Data Cuenta. En: http:// 
hasselfallas.com/2014/09/ll/simpllficar-es-clave-para-crear-aplicaciones-de-noticias/ [Visualizado: 25 de 
noviembre de 2015], 

15 Citado en: KAPLAN, David. “Periodismo de Investigacion Global: Estrategias para su Financiamiento”. 
Center for International Media Assistance, 2013. 

16 “Journalists today have to be swiss army knives”. Entrevista a Evan Smith en The future of news. En: 


de mantener competencias separadas es un anacronismo compara- 
ble al de quienes en su momento se resistieron a dejar la maquina 
de escribir por la computadora. El editor lo explica con una escena 
que todavia debe enfrentar a pesar de que su medio trata de incidir 
en proyectos multimedia. “La gente viene y me dice: ‘Quiero ser un 
redactor’. ^De que tipo? ‘Solo quiero escribir, nada mas que escribir’. 
<i,No quieres grabar un video con tu telefono, editarlo y postearlo? 
‘No’. ^No quieres grabar audio en tu telefono, editarlo y postearlo? 
‘No’. <^No quieres hacer nada en HTML basico? ‘No’. <j,No quieres en- 
cargarte de las redes? ‘No’. Entonces esto es lo que vas a hacer: ve 
a Home Depot (una tienda de materiales), compra mucha madera, 
construye una maquina del tiempo y regresate al Esquire de 1964, 
porque esa fue la ultima vez que alguien tuvo ese trabajo”. La figura 
de la navaja no es retorica: puede que el reportero no use esas he- 
rramientas todos los dias, pero la idea es que esten ahi cuando se 
necesiten. 


http://futureof.news/episodes/evan-smith-2/?utm_campaign=refdotfonesmithvideo2&utm_source=Twit- 
ter&utm_medium=esmith2Jrsch_hd_flw [Visualizado: 25 de noviembre de 2015]. 
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D esde que Wikileaks dinamito la industria global de los se- 
cretos, el periodismo de investigation se ha visto envuel- 
to en una fiebre por los datos. Ahora es posible rastrear 
la corruption en varios continentes, detectar empresas y personajes 
que buscan evadir impuestos en todo el mundo, o entender los movi- 
mientos internacionales del crimen organizado. En setiembre de 2011, 
el periodista australiano Gerard Ryle, del Consorcio International de 
Periodistas de Investigation (ICIJ), recibio un disco duro con 2.5 mi- 
llones de archivos. Dos ingenieros en computation convirtieron esa 
marejada en una base de datos confiable. A partir de alii se realizo un 
intenso reporteo que revelo las operaciones de mas de 122 mil empre- 
sas y 130 mil personas en las sombras del sistema financiero mundial. 

El hallazgo desperto elogios, pero tambien alertas. “El periodismo 
de investigation no debe confundirse con lo que ha sido etiquetado 
como ‘periodismo de filtraciones’”, dice David Kaplan. Esta observa- 
tion es un misil al centro del debate sobre el encuentro entre perio- 
dismo y tecnologia. ^Son validos los documentos obtenidos por hac- 
keo? iComo hacer que nos digan lo que en verdad necesitamos saber? 
Hay que ver las hojas de calculo como fichas forenses de la realidad: 
ofrecen detalles, pero la verdad requiere trabajo. “Las habilidades 
basicas de los periodistas de investigation -senala Kaplan- son si- 
milares a las de los mas calificados fiscales y policias, antropologos 
de campo e investigadores privados: el uso de fuentes primarias, ve- 
rification de la evidencia, entrevistas a testigos de primera mano, y 
el seguimiento a los rastros de personas, documentos, y el dinero”. 

Las mejores muestras del periodismo de investigation reciente 
se han generado tambien por el acceso a information publica o la 
construction de bases de datos nuevas, con information recopilada 
de diferentes fuentes, para responder a una pregunta que nadie se 
habfa hecho antes. A continuation algunos ejemplos notables. 

LA NAVAJA SUIZA 
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Offshore Leaks 


INVESTIGACIONES 
CON DATA 
FILTRADA 

Pocos procesos muestran las 
peculiaridades de la epoca como 
la filtracion de datos. A las nuevas 
formas de interconexion con las 
fuentes, mediante programas 
informaticos especializados, se 
suma el desaflo de entender 
cantidades de informacion 
que podrian sepultar cualquier 
entusiasmo si no contaramos con la 
ayuda de los programadores. Estos 
casos lo demuestran. 


MEDIO 


Consorcio Internacional de 
Periodistas de Investigacion 
(ICIJ) 

Fue un esfuerzo global liderado por el Consorcio Inter- 
nacional de Periodistas de Investigacion (ICIJ) con la co- 
laboracion de The Guardian, BBC, Le Monde, The Was- 
hington Post y una treintena de medios. Conto con el 
trabajo de 112 reporteros de 56 paises. 


Fecha: Abril 2013 


E33Z3Z33EEI 

Politicos, aristocratas, banqueros y criminales de diver- 
sos paises usaron paraisos fiscales para crear compariias 
o fideicomisos con el fin de ocultar sus bienes o capita- 
ls, y en muchos casos evitar el pago de impuestos. En la 
lista aparecen el presidente de Azerbaiyan, Ilham Aliyev 
y su familia; Jean-Jacques Augier, tesorero de la campa- 
ria electoral del presidente trances Francois Hollande; la 
baronesa espariola Carmen Thyssen-Bomemisza, quien 
utilizo canales offshore para comprar obras de arte; y 
Maria Imelda Marcos, hija del exdictador filipino Ferdi- 
nand Marcos. 
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NALISIS DE DATOS 


Fa filtracion era 160 veces mas grande que los docu- 
mentos diplomaticos liberados hasta entonces por 
Wikileaks. El ICIJ conto con la ayuda de expertos en 
informatica como Sebastian Mondial, de Alemania; 
Duncan Campbell y Matthew Flower, de Inglaterra; el 
costarricense Rigoberto Carvajal y el makes Matthew 
Caruana. Elios hicieron la limpieza y organizacion de los 
datos mediante la herramienta OpenRefine. El progra- 
ma dtSearch los ayudo a rastrear nombres entre 260 
gigabytes de datos. Y con el software Nuix obtuvieron 
conexiones de palabras clave incluidas en los archivos 
adjuntos de los correos electronicos de varias personas, 
sin necesidad de abrir los documentos. Tambien usaron 
el software fibre Talend Open Studio para integrar y or- 
ganizar los datos en graficos de relaciones. 

Eos programadores consiguieron reconstruir el sistema 
de software de las empresas que prestaban sus servicios 
de creacion de offshore. Esta crucial tarea allano el te- 
rreno para que los periodistas iniciaran sus pesquisas, 
ya que pudieron navegar por archivos completamente 
estructurados y conocer quienes estaban detras de las 
empresas creadas, quienes eran sus socios, intermedia- 
ries y beneficiarios. 

El analisis del disco duro detecto mas de 100 mil em- 
presas extranjeras o fideicomisos localizados en lugares 
como las Islas Virgenes, Hong Kong, Islas Caiman, en- 
tre otros. Los documentos revelaron la participacion de 
12.000 agentes intermediarios y 130.000 personas de 
170 paises. 

En junio de 2013, el ICIJ y la Unidad de Investigacion 
del diario La Nacion de Costa Rica, dirigida por Giannina 
Segnini, lanzaron la aplicacion Offshore Leaks Database, 
que permite buscar por nombres o por paises. 



IMPACTO 


El caso sacudio Europa y provoco dimisiones de alto 
nivel, como las del ministro de Economia de Francia, 
Jerome Cahuzac, y el portavoz adjunto del Parlamento 
de Mongolia, Bayartsogt Sangajav, por ocultar cuentas 
bancarias en Suiza. Se abrieron investigaciones judicia- 
les contra funcionarios y empresarios en Filipinas, In- 
dia, Grecia y Corea del Sur. Distintos colectivos sociales 
promovieron camparias contra los paraisos fiscales. En 
febrero del 2015, el ICIJ fue reconocido con el premio 
George Polk Award, uno de los principales de EE.UU. en 
la categoria Business Reporting. 


(p http://www.icij.org/offshore 
http://offshoreleaks.icij.org/ 


t La Comision de la Bolsa de Valores de EE.UU. usa el programa Nulx para 
fiscalizar los correos electronicos que confisca a sociedades anonimas 
cuando sospecha de un presunto comportamiento ilicito. 
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Lux Leaks 


MEDIO 


Consorcio 
Internacional de 
Periodistas de 
Investigacion 
(ICIJ) 

Otro proyecto colaborativo lidera- 
do por el ICIJ. Conto con 80 repor- 
teros de 26 palses. 


Fecha: Noviembre 2014 


'ssnsssEsn 

Mas de 340 compahias, entre las 
que figuran Apple, JP Morgan, 
FedEx, Amazon y Pepsi, firmaron 
acuerdos fiscales secretos con Lu- 
xemburgo para evadir impuestos. 
Esos tratos, aprobados entre 2002 
y 2010, representaron miles de 
millones de dolares de ingresos 
fiscales perdidos para los Esta- 
dos donde estas empresas obtu- 
vieron beneficios. Los acuerdos 
fueron firmados cuando el actual 
primer ministro de Luxemburgo, 
Jean-Claude Juncker, era ministro 
de Finanzas del ducado. 



NALISIS DE DATOS 


El ICIJ accedio a un archivo de 4.4 gigabytes que contenia 28.000 paginas de 
documentos. Durante seis meses, 80 periodistas se unieron en una platafor- 
ma de comunicacion segura llamada Enterprise, implementada por el ICIJ 
para organizar el analisis del contenido. Esta herramienta permitia compartir 
desde transcripciones de entrevistas y fotos hasta material confidencial. “Era 
lo mas parecido a una redaccion global”, ha dicho Marina Walker, subdirectora 
del consorcio. Cada reportero reviso documentos financieros muy complejos, 
relacionados a empresas de su pais. El ICIJ recibio asesoria de especial istas en 
finanzas y tributacion. En paralelo a la investigacion de los periodistas, el ICIJ 
formo un equipo de reporteros e ingenieros en computacion que elaboro una 
base de datos de exploracion publica. 


IMPACTO 


La Comision Europea investigo si las practicas de Luxemburgo constituyeron 
un sistema fiscal adaptado a la medida de las grandes corporaciones en detri- 
mento del derecho comunitario. 

El ICIJ recibio el George Polk Award en la categoria Business Reporting, y el 
Data Journalism Award a Mejor Investigacion del 2015, junto a los Swiss Leaks. 
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p http://www.icij.org/project/luxembourg-leaks 


Swiss Leaks 


ANALISIS DE DATOS 


IMPACTO 


MEDIO 


ICIJ, The 
Guardian, CBS, 

Le Monde, 
Siiddeutsche 
Zeitung y The 
Washington Post 

Tercer proyecto colaborativo in- 
ternacional del ICIJ, en colabora- 
cion con The Guardian, CBS, Le 
Monde, Suddeutsche Zeitung y 
The Washington Post. Incluyo a 
154 periodistas de 47 paises. 


Fecha: Febrero 2015 


iimj.iKm.iii 

La filial suiza del Banco HSBC es- 
tablecio un sistema de evasion fis- 
cal que ayudo a mas de 100 mil 
clientes acaudalados de 203 pai- 
ses del mundo a ocultar su dinero 
para evitar el pago de impuestos 
entre los anos 2005 y 2007. En 
la lista de beneficiarios figuraban 
miembros de la realeza, politicos, 
celebridades, traficantes de drogas 
y empresarios con cuentas que, en 
conjunto, superaron los 100 mil 
millones de dolares. 


Se basa en registros de cuentas 
bancarias secretas de clientes del 
banco HSBC sustraidos por el in- 
formatico y ex empleado de su 
filial suiza, Herve Falciani. El dis- 
co duro contenia 2.5 millones de 
archivos. A principios de 2014, el 
diario frances Le Monde tuvo ac- 
ceso a los datos y los paso al ICIJ 
para disenar una forma de inves- 
tigarlos. El primer paso fue re- 
crear la base de datos de clientes 
del HSBC a partir de los archivos 
pianos de Excel disponibles. En se- 
guida se hicieron relaciones entre 
los nombres y los paises. Luego se 
usd el software Talend para trans- 
fers la base de datos original a la 
base de datos grafica Neo4j, que 
permite organizar relaciones. La 
herramienta Linkurious facilito la 
visualizacion y el proceso de anali- 
sis. Los reporteros participantes se 
comunicaban a traves de la plata- 
forma Voyager -creada con un sof- 
tware de codigo abierto llamado 
Oxwall-, que permite desde armar 
foros tematicos hasta compartir 
archivos. La base de datos dio pie 
a un diagrama de 275 mil nodos 
con 400 mil relaciones entre ellos. 


En febrero de 2015, la Fiscalia de 
Suiza abrio una investigacion pe- 
nal contra el banco HSBC por la- 
vado de dinero agravado. En Reino 
Unido, la agenda recaudadora de 
impuestos recupero 236 millones 
de dolares de algunos de los 3.600 
britanicos identificados como 
usuarios de la sucursal del HSBC 
en Ginebra, pero solo abrio proceso 
a una persona. Francia inicio 103 
acciones judiciales contra el mis- 
mo numero de personas. 

En junio de 2015, el ICIJ recibio el 
Data Journalism Award en la cate- 
goria Mejor investigacion del ano. 



p http://www.icij.org/project/swiss-leaks 
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INVESTIGACIONES 
CON DATA 
PUBLICA 

Noventa paises del mundo -catorce 
en America Latina y 
El Caribe- tienen leyes de acceso 
a la informacion publica, segun 
la Alianza Regional para la Libre 
Expresion e Informacion. Este 
escenario representa una ventaja 
para el periodismo de investigacion: 
es posible rastrear la gestion del 
Estado o como influye el poder 
corporativo en sus decisiones y 
como esto impacta en la vida de los 
ciudadanos. 


Atrapados por el 
Desarrollo^^^l 


Evicted and Abandoned: 

The World Bank’s Broken Promise to the Poor 


MEDIO 


The Huffington Post, The 
Guardian, The Ground Truth 
Project, The Investigative 
Fund 

Trabajo en conjunto con medios y organizaciones como 
el Huffington Post, The Guardian, el Ground Truth Pro- 
ject y el Investigative Fund. Involucre a 50 periodistas 
de 21 paises. 


Fecha: Abril 2015 
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Mas de tres millones de personas de condicion vulne- 
rable fueron desplazadas de las zonas donde vivian por 
cerca de mil proyectos financiados por el Banco Mundial 
en 124 paises entre los anos 2004 y 2013. 
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IMPACTO 


POST 10! J 


EVICTED 

& ABANDONED 



El Banco Mundial anuncio un plan 
para mejorar la supervision de pro- 
yectos de desarrollo y evitar malas 
practicas que causen desplazados. 
La Online News Association recono- 
cio a esta investigacion con el pre- 
mio Online Journalism Award en la 
categoria Periodismo de investiga- 
cion innovador. 


NALISIS DE DATOS 


A comienzos de 2014, el periodista estadounidense Sasha Chavkin observo 
que los reportes del Defensor del Pueblo del Banco Mundial, que supervisa las 
actividades del organismo, contenian decenas de reclamaciones de comuni- 
dades desalojadas por proyectos financiados por el banco en varios paises en 
desarrollo. Chavkin descargo mas de 6600 documentos del BM para construir 
un registro de los proyectos, los beneficiarios de los prestamos y las denun- 
cias. La informacion de los casos entre 2004 y 2013 estaba incompleta. Para 
confrontarla, se bused fuentes dentro de la organizacion, exfuncionarios y 
expertos. Los datos permitieron identificar un patron: el BM y la Corporacion 
Financiera Internacional -su brazo inversor en el sector privado- no respe- 
taron sus politicas para proteger a quienes pueden verse perjudicados por 
los proyectos que financia. Incluso dio prestamos a gobiernos y companias 
acusados de violar derechos humanos. Los reporteros, que viajaron a paises 
como Sudan del Sur, Etiopia, Guatemala o Peru, se comunicaban mediante la 
plataforma Odyssey. 


(p http://www.icij.org/project/world-bank 
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NALISIS DE DATOS 


Congresistas 
respaldan ■ 
legislacion I 
que podria I 
beneficiarlos 
a si mismosl 
y a sus 
familiares m 


Congress members back 
legislation that could benefit 
themselves, relatives 


MEDIO 


The Washington 
Post (EE.UU.) 


Fecha: Octubre 2012 


JEESESSEEI 

Setenta y tres legisladores esta- 
dounidenses aprobaron normas 
que afectaban sus inversiones o 
beneficiaban a sus familiares gra- 
cias a que no estaban obligados a 
declarar sus potenciales conflictos 
de interes. 



El equipo armo una base de datos en Excel con los formularios de informacion 
financiera y los registros publicos de los 535 miembros del Senado de EE.UU. 
Luego, contrasto las inversiones personales de los legisladores con reportes 
de sus actividades monitoreadas por LegiStorm, grupo de vigilancia sin fines 
de lucro. La informacion tambien fue cruzada con informes de la Oficina de 
Administracion y Presupuesto de la Casa Blanca. Se detectb casos como el de 
un legislador que facilito la aprobacion de exoneraciones tributarias para pro- 
pietarios de caballos y luego compro siete ejemplares de raza. Otro patrocino 
un proyecto de ley que beneficio a la compania de gas natural en la que su 
esposa era accionista. 



IMPACTO 


El Congreso puso a debate su reglamento de conducta etica y abrio investiga- 
ciones a los senadores con claros conflictos de intereses. 


(p https://goo.gl/9WbZbT 
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Senales 

ignorad; 



consecu 

w 

encias 

fatales| 



Missed signs, 
fatal consequences 


MEDIO 


Austin American- 

Statesman 

(EE.UU.) 


Fecha: Enero 2015 


E33S3ESE23 

Entre 2010 y 2014, el Departa- 
mento de Familia y Servicios de 
Proteccion Infantil de Texas tuvo 
un sistema fallido de supervision 
que permitio la muerte de 655 
nifios a manos de sus familiares 
o cuidadores. Los funcionarios no 
adoptaron las acciones necesarias 
para protegerlos. 


Austin Amcrican-Statcsman 

INVESTIGATES 


Introduction Part i 

Missed signs Gaps in protection 


Part 2 Part 3 Interactive 

Stumbling blocks Inside CPS Explore the data 



Child fatality cases can often languish 
after charges are filed, while lack of 
evidence leaves others unsolved. 
Children are left at risk with their 
parents' unmarried partners, whom CPS 
has difficulty monitoring, or when the 
agency loses track of families. 


Challenges to 
investigations 


ANALISIS DE DATOS 


El proyecto se inicio con la obtencion de 779 informes de muertes de ninos 
por casos de violencia en sus hogares. Los documentos, solicitados por trans- 
parencia, solo estaban disponibles en PDF. Los periodistas tuvieron que trans- 
ferir su contenido a un formato analizable en el que abrieron varios campos 
para llenar y ordenar la informacion. Usaron Caspio, un servicio en linea muy 
amigable para gestionar bases de datos, que se basa en el sistema Microsoft 
SQL Server. Con esta herramienta se establecio que los empleados del servicio 
de proteccion infantil habian visitado varias veces a las victimas, pero que no 
tomaron en cuenta las senales de riesgo. El trabajo de seis meses incluyo la 
reconstruccion de los hechos con entrevistas, cotejo de documentos y visitas 
a los hogares afectados. 


IMPACTO 


El Departamento de Familia y Servicios de Proteccion Infantil de Texas refor- 
mulo el sistema de investigacion de abusos de menores y abrio una investi- 
gacion a 50 empleados por diversos delitos. 

El sitio Austin American-Statesman gano el premio Online Journalism 
Awards 2015 otorgado por la Universidad de Florida en la categoria Investi- 
gative Data Journalism. 


p) http://projects.statesman.com/news/cps-missed-signs/ 
















MEDIO 


La Nacion 
(Costa Rica) 


umnnoiiDATA 

HU 


-oooo 


□ □□□ 

© Imprlmir 
SB Enviar 


Ministro de Hacienda renuncia tras 
enterarse de investigacion 
periodistica 

POR GIANNINA SEGNINI / POR | ERNESTO RIVERA - ACtudMTMO £< 3 0E 0OT1I de 20129 1200am 

■ Empresa fundada por el y por su esposa omltlo ingresos en declaration de renta 
• El domingo, Laura Chlncliilla le pidio enviar. a la brevedad. ‘respuescas Claras' 


MAS SOBRE ESTETEMA 

0 E°p^ 5afundadaporHerrero 


Dos dias despues de recibir un cuestionario sobre una 
investigacion periodistica que preparaba este diario. Fernando 
Herrero renuncio a su cargo de ministro de Hacienda, ayer en 
la tarde. 



La Nacion estaba preparando un informe, que se publica en la 
edicion de hoy, sobre las declaraciones de impuesto sobre la 
renta de una compania fundada por Fernando Herrero y su 
esposa, Flor Isabel Rodriguez, quien ayer tambien dimitio 


ULTIMAS NOTICIAS 






Fecha: Abril 2012 


'SSnSSSEEi 

La mitad de ministros de la presi- 
denta de Costa Rica, Laura Chin- 
chilla, subvaluo sus propiedades 
para pagar menos impuestos entre 
el 2009 y 2010. 


NALISIS DE DATOS 


El equipo, conformado por dos reporteros y dos ingenieros en computacion, 
organizo una base de datos en Excel con la informacion de las propiedades 
de los ministros que figuraba en los registros publicos, los valores que habian 
declarado en los formularios de impuestos entregados a los municipios donde 
se ubican sus inmuebles y los valores homogeneos de los mismos conforme 
a los calculos establecidos por el Ministerio de Hacienda. Las dos primeras 
bases fueron descargadas por uno de los ingenieros. La tercera fue construi- 
da conforme a las operaciones aritmeticas necesarias para calcular el valor 
de las propiedades. A1 cruzarlas, detectaron a los funcionarios infractores. La 
investigacion alcanzo a los familiares de los ministros, porque en varios casos 
las propiedades estaban a nombre de las conyuges. La serie se publico en la 
edicion impresa de La Nacion con una infografia de las revelaciones. 


IMPACTO 


Se actualizaron los valores de las propiedades de todos los funcionarios publi- 
cos implicados. En el 2013, el Instituto de Prensa y Sociedad (IPYS) concedio 
al equipo el Premio de Periodismo de Investigacion Latinoamericano por su 
buen manejo de la informatica para potenciar el reporterismo en la vigilancia 
de la gestion publica. 
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(p http://goo.gl/16ndl8 


6 


INSTRUMENTOS 
PARA CONTAR 
MEJORES HISTORIAS 


W 


[Como enriquecer un relato con graficos, 
infografiasy hastaf rases sonoras] 




1. Data wrapper: 

https://datawrapper.de/ 


Permite seleccionar datos de una 
hoja de calculo y convertirlos 
en graficos y mapas explicativos 
con tipos de color y fuentes 
personalizados. Da opcion de 
hacer diagramas de torta, fiebres 
o barras. 



2. TimelineJS: 


http://timeline.knightlab.com/ 


Se usa para crear cronologias 
interactivas, con fotos, videos, 
e hipervinculos. No se necesita 
abrir una cuenta. Uno inserta las 
fechas, textos y los URL en una 
hoja de calculo de Google y la 
herramienta los organizara para 
visualizarlos de una forma muy 
atractiva. 


3. Infogr.am: 

https://infogr.am/ 


Desarrolla infografias en linea. 
Ofrece plantillas que permiten 
mostrar datos en barras, circulos, 
fiebres. Uno puede insertar la 
informacion en su formato o 
importar archivos en Excel o Csv. 
Tiene una version gratuita y una 
Premium de paga. Es posible 
compartir los graficos a traves de 
Facebook, Twitter y Pinterest. 


4. Tableau Public: 

ittps://public.tableau.com/ 


Convierte los datos de una hoja 
de calculo en graficos interactivos 
(mapas, tablas, barras) y crea 
filtros para que los usuarios 
hagan consultas y tengan 
resultados personalizados. No se 
necesita saber programacion para 
usar esta herramienta. 


5. StoryMapJS: 

Tttp://storymap.knightlab.c 


Crea historias basadas en 
lugares identificados en un 
mapa. Permite insertar videos, 
tuits, textos o imagenes para 
mostrarlos en forma de una 
galena asociada a cada sitio 
seleccionado. Tambien se inserta 
la informacion en una hoja de 
calculo de Google. 


6. Soundcite: 

Tttps://soundcite.knightlab.com/ 


Coloca sonidos a una palabra o 
una frase de un texto. Se sube 
el archivo MP3 a SoundCloud, 
luego hay que seleccionarlo 
desde Soundcite y se ajusta el 
fragmento deseado. Se generara 
un codigo para insertarlo en la 
frase escogida, lo que enriquece 
la experiencia de leer con sonido. 











INVESTIGACIONES 
CON BASES 
CONSTRUIDAS 

En los ultimos anos, grandes 
casos nacieron de proyectos de 
investigacion con bases de datos 
que los propios periodistas se 
encargaron de construir. Aqm 
reunimos trece experiencias que 
pueden inspirar el desarrollo de 
nuevos temas. 


^Quien esta detras del 
derrumbe financiero?! 


Who’s Behind the Financial Meltdown? 


MEDIO U ORGANIZACION 


The Center for Public 
Integrity (EE.UU.) 


Fecha: Mayo 2009 


nsnsssEEi 

Las corporaciones estadounidenses Lehman Brothers, 
Merrill Lynch, JP Morgan & Co., Citigroup, Goldman Sa- 
chs & Co. y el banco suizo Credit Suisse First Boston 
fueron parte del negocio que genero la denominada bur- 
buja inmobiliaria que quebro el sistema financiero. Esas 
corporaciones eran propietarias de 21 de las 25 prin- 
cipales empresas de la industria subprime que otorgo 
creditos hipotecarios de vivienda de alto riesgo, lo que 
desataron la crisis economica de 2008, y luego se bene- 
ficiaron del rescate financiero. 
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IMPACTO: 


Who’s Behind 
the Financial 
Meltdown? 


La serie periodistica contribuyo 
a que el Congreso de EE.UU. for- 
mara una comision investigadora, 
cuyas conclusiones fueron que el 
desastre pudo evitarse y que la 
crisis fue resultado de fallos en las 
regulaciones, mala gestion empre- 
sarial y el riesgo irresponsable de 
Wall Street. 


NALISIS DE DATOS 


El editor de datos del CPI, David Donald, comenzo un analisis de 350 mi- 
llones de solicitudes de hipotecas aprobadas desde 1994 hasta el 2007. La 
informacion habia sido previamente recogida de los documentos publicos del 
Home Mortgage Disclosure Act (el sistema de registros de prestamos basado 
en la Ley de Divulgacion de Hipotecas) y organizada en hojas de calculo por el 
Instituto Nacional de Periodismo Asistido por Computadora (NICAR, por sus 
siglas en ingles). El analisis permitio identificar que la mayoria de prestamos 
de alto riesgo por mas de un billon de dolares fue otorgada entre el 2005 y 
el 2007. Esto permitio establecer quienes fueron los principales adjudicado- 
res. Un equipo de reporteros colaboro con perfiles de los prestamistas y se 
incluyo informacion sobre las contribuciones de las empresas involucradas 
a los miembros del Congreso de EE.UU. Para visualizar la ubicacion de cada 
vivienda sujeta a prestamo subprime se empleo mapas de calor hechos con el 
Palantir Government Software, que ofrece una potente herramienta de anali- 
sis visual usada tanto en proyectos academicos como en gestion de desastres 
o programas de inteligencia. 


q } http://goo.gl/cVXlee 
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Los diarios 
secretos de 
Parana^H 


Diarios Secretos 


MEDIO 


Gazeta do Povo 
en colaboracion 
con RPCTV 
Parana (Brasil) 


Fecha: Marzo 2010 


zsnsssEEi 

Entre el 2006 y 2009, la Asamblea 
Legislativa de Parana (Brasil) ocul- 
to un esquema de desvio de fon- 
dos publicos que incluia la contra- 
tacion de empleados fantasmas, 
sobrecostos de servicios, casos de 
nepotismo y otros delitos. La mal- 
versacion habria llegado a los 400 
millones de dolares. 



I SABEDEALGO? 
Envie sua denuncia 


B FISCAL1ZE 

Consutte os e-mails dos deputados 


NOTI'CIAS NOTlCIAS + QUEM + 

+ LIDAS COMENTADAS COMENTOU 


Por Dentro dos Diarios Secretos 


ULTIMAS 


A Gazeta do Povo e a RPCTV apresentam a base de dados com todas as 
movimenta0es de funcionarios da Assembleia Legislativa do Parana que aparecem 
nos diarios oficiais da casa publicados entre 1 de janeiro de 2006 e 31 de margo de 
2009. 


16h39 Bibinh0 6 preso novamente nessa sexta 

IlhIO Bltllnf10 e solto em Brasilia, apos veneer 
prisSo temporaria 


Das 526 edigoes consultadas, 209 possuem atos e portarias, que resultaram em mais 
de 8 mil linhas de informagoes. Esse banco serviu como uma das principals fontes de 
informagoes para todas as reportagens produzidas na serie Diarios Secretos e agora 
fica disponfvel ao publico. A publicagao da base e para que voce, leitor, tambem faga a 
sua parte fiscalizadora e cidada. 


1 6h29 Veja ° video do momento da prisao de 
Bibinho em Brasilia 


09h47 J ust '£ a prorroga prisao de Bibinho a< 


11h17 e preso emopera^ao do MP 

contra lavagem de dinheiro 


» Ver mais ULTIMAS 


NALISIS DE DATOS 


Los periodistas James Alberti, Katia Brembatti, Karlos Kohlbach y Gabriel Ta- 
batcheik recopilaron las gacetas legales de la Asamblea Legislativa de Parana 
publicadas entre 1998 y 2009, varias de las cuales no estaban disponibles 
en los archivos de la propia asamblea. Digitalizaron a mano el contenido de 
724 boletines legales para armar una base de datos en Excel que mostrara 
las contrataciones del personal y el manejo de los presupuestos senalados en 
las gacetas. Asi pudieron identificar una veintena de empleados fantasmas, 
incluso personas muertas o ninos. El equipo periodistico tambien detecto que 
se habia empleado a parientes de los legisladores e hijos de magistrados. El 
analisis de datos se completo con testimonies y fuentes documentales. Luego 
compartieron en un buscador publico todas las gacetas oficiales, incluidas las 
que faltaban en el archivo de la Asamblea. 


IMPACTO 


Desde la publicacion hasta marzo de 2015, catorce funcionarios y exemplea- 
dos de la Asamblea Legislativa de Parana fueron condenados a prision por 
malversacion de fondos y otros delitos. 

“Los diarios Secretos de Parana” gano el Global Shining Light Award y el Pre- 
mio Latinoamericano de Periodismo de Investigacion en el 2011. 
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Los rostros del 
desamparofeg;? 


ANALISIS DE DATOS 


MEDIO 


La Nacion 
(Costa Rica) 


Fecha: Febrero 2011 


Z523ESEE] 

El programa oficial de subsidios 
educativos Avancemos cubre los 
estudios de jovenes abandonados 
por padres con elevados recursos 
economicos. 


http://goo.gl/BfMkQC 


Esta serie investigativa se inicio con la hipotesis de que podrian existir abusos 
en la concesion del beneficio de las becas de Avancemos, un programa de 
subsidios para estimular que mas de 167 mil jovenes continuen sus estudios. 
El equipo, liderado por Giannina Segnini, accedio a la base de datos de los 
beneficiarios, la completo con los nombres de sus padres, y la cruzo con los 
ingresos y bienes familiares. Un primer cruce revelo que 75 becarios tenian 
padres con salarios de entre dos mil y nueve mil dolares. Sin embargo, el 
hallazgo dio un giro cuando los reporteros buscaron en persona a los benefi- 
ciarios: resulto que eran hijos de personas con recursos economicos, pero que 
habian sido abandonados y ahora vivian en la pobreza con algun pariente. 
La investigacion duro tres meses y derivo en nueva historia mas reveladora 
que la hipotesis inicial: el Estado estaba subsidiando la educacion de jovenes 
desamparados por padres con patrimonio. En este proyecto trabajaron tres 
desarrolladores, tres disenadores y 4 periodistas. Fue acompanado con un 
especial multimedia. 



IMPACTO 


La investigacion recibio una mencion especial en el II Premio Regional de 
Periodismo, Pobreza y Derechos Humanos en Centroamerica en 2011. 

El Instituto Mixto de Ayuda Social (IMAS) cambio el criterio para otorgar las 
becas del programa Avancemos a seleccion por nivel academico. 
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Medicos sin 
control:^H 
los duenosl 
de la salud I 




en Chile 



CIPER (Centro 
de Investigacion 
Periodistica) 


Fecha: Septiembre 2010 


Un seguimiento de un ano a cinco 
hospitales de Chile demostro que 
no fiscalizaban la asistencia de los 
medicos ni el uso que hacen de la 
infraestructura de servicios de sa- 
lud en beneficio de sus intereses 
personales y en perjuicio de los 
pacientes. 


NALISIS DE DATOS 


A fines de julio de 2009, CIPER solicito los registros de asistencia de los medi- 
cos de cinco hospitales de Santiago de Chile. Para obtenerlos tuvo que superar 
varias trabas, porque algunos hospitales se negaron a entregar la informacion 
y otros la entregaron incompleta. El equipo logro acceder a mas de 35 mil 
registros de asistencia. Despues de pasar la informacion a una hoja de calculo, 
la cruzo con los horarios que los profesionales deben cumplir en los policlini- 
cos y en sus consultas particulares o en clinicas privadas. En forma paralela, 
visito los hospitales seleccionados para observar en terreno el cumplimiento 
de los horarios. Asi comprobo que varios medicos usaban la infraestructura 
para atender a sus pacientes privados. Tambien se evidencio que no cumplian 
con las jornadas estipuladas en sus contratos. 


IMPACTO 


Siete meses despues de publicada esta investigacion, la Contraloria General 
de la Republica de Chile publico un informe que confirmo las infracciones de 
los medicos en 13 hospitales del pais. 

La serie investigativa obtuvo una mencion honrosa en el Premio Latinoame- 
ricano de Periodismo de Investigacion entregado el 2011. 


(p http://ciperchile.cl/multimedia/medicos-son-control/ 
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Dolares para 
los doctoresl 


Dollars for docs 


MEDIO 


ProPublica en 
asociacion con 
The Boston 
Globe, Consumer 
Reports, 

NPR, Chicago 
Tribune y Public 
Broadcasting 
Service (PBS). 


Fecha: Octubre 2010 


3SEESSH1 

Entre los anos 2009 y 2010, siete 
companias farmaceuticas hicieron 
pagos individuales de mas de cien 
mil dolares a 17.000 medicos para 
que promovieran y prescribieran 
sus medicamentos en EE.UU. 


ANALISIS DE DATOS 


Las siete farmaceuticas habian publicado esta informacion en sus sitios web, 
pero estaba en formatos dificiles de analizar (PDF y JPG). Dos periodistas y un 
desarrollador la descargaron y organizaron en un Excel que se podia desglo- 
sar en categorias como: consultorias, comidas, viajes y regalos. Por primera 
vez se tuvo el panorama de los pagos a medicos realizados por companias 
que representaban del 36% de la industria farmaceutica en EE.UU. El equipo 
utilizo la herramienta Open Refine para limpiar y uniformizar los nombres de 
los medicos beneficiados. Luego los cruzo con las bases de datos publicas de 
licencias para ejercer la medicina y de expedientes disciplinarios. ProPublica 
presento esta investigacion con una aplicacion periodistica en la que cual- 
quier persona puede buscar el nombre de su medico para conocer si recibio 
pagos para promover determinado producto. Tres anos despues, la base de 
datos fue actualizada hasta evidenciar pagos por cuatro billones de dolares a 
681.432 medicos por parte de 1.630 farmaceuticas o fabricantes de productos 
medicos. 


IMPACTO 


En el 2012 se promulgo una ley que convierte en obligatoria la publicacion de 
los regalos y pagos por marketing a los medicos en EE.UU. 

Mas de 125 organizaciones de noticias -como el Boston Globe o el Chicago 
Tribune- hicieron investigaciones basadas en la herramienta. 


S 


https://projects.propublica.org/docdollars/ 
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Terrorists for the FBI 


MEDIO 


Mother Jones 
(EE.UU.) 


Fecha: Agosto 2011 


uwnximTl 

Informantes del FBI fabricaron 
pruebas para incriminar a sospe- 
chosos de atentar contra la segu- 
ridad de EE.UU. con el fin de re- 
clamar recompensas de 100.000 
dolares como parte de la cruzada 
contra el terrorismo. 


Mother Jones 


ENVIRONMENT 


PHOTO ESSAYS 


SUBSCRIBE 


Must Reads: Inside the Men's Sights Movement The Most Radical Idea in Pro Sports The NRA's Murder Mystery 


J | Search J 


terrorists for the fbi 



SEE THE MAP | WATCH THE VIDEO | READ INTERNAL FBI DOCUMENTS 
PROFILES IN TERROR 

Click on an image to view information about each terrorism defendant, or browse the 
whole database. 



NALISIS DE DATOS 


El periodista Trevor Aaronson examino mas de 500 casos de personas acu- 
sadas de terrorismo y encontro que casi la mitad habia tenido como eje la 
participacion de un informante del FBI. Aaronson combino data extralda de 
archivos judiciales de distintos estados, documentos del FBI, entrevistas a 
agentes y los abogados de los acusados. Paso meses trabajando con un asis- 
tente en constmir una base de datos. En un primer momento utilizo Excel y 
el gestor MySQL, que ayuda a constmir bases de datos relacionales. Luego el 
equipo utilizo el lenguaje Drupall para constmir una herramienta de busque- 
da en linea. 


IMPACTO 


FBI investigo a los agentes acusados de fabricar casos, mientras que parte de 
los informantes involucrados ha sido objeto de procesos judiciales. 

La investigacion obtuvo el premio Data Journalism Award 2012 en la catego- 
ria Data-Driven Investigation. 


(p http://goo.gl/hKemOp 
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Metadona y ■ 
la politica del 

dolor^^^^H 


Methadone and the politics 
of pain 


MEDIO 


The Seattle 
Times (EE.UU.) 


Fecha: Diciembre 2011 


El programa Medicaid, dirigido a 
personas de bajos recursos, en- 
trego el narcotico metadona a sus 
pacientes para abaratar costos en 
sus compras de medicamentos 
sin tomar en cuenta los danos a 
la salud producidos por este anal- 
gesico. Como consecuencia, 2.173 
personas fallecieron entre los anos 
2003 y 2011. 


micSeattic©mEs Special reports 

Winner of Nine Pulitzer Prizes L P 



Travel | Opinion 


I - „J _« 


METHADONE AND THE POLITICS OF PAIN 



State pushes prescription 
painkiller methadone, saving 
millions but costing lives 

To cut costs. Washington steers Medicaid patients lo a narcotic that costs 
less than a dollar a dose The state Insists methadone Is safe But 
hundreds die from It each year — and more than anyone else. Its the poor 


MORE IN THE SERIES: 

■ Update: 'Preferred' pain drug now called last resort 

■ Update: State plans emergency warning on risks of methadone 
video: Methadone’s toll 

ill Timeline: State defends methadone as deaths rise 

■ Silent deaths: source documents 

■ How we did it: our analysis 

■ Seattle Times methadone investigation wins 2012 Pulitzer Prize 
Df Times awarded Selden Ring Award for Investigative Reporting 


ANALISIS DE DATOS 


Ante la alerta de varios medicos, dos periodistas buscaron todos los registros 
disponibles en Washington para rastrear el numero y circunstancias de los 
fallecimientos vinculados a este narcotico. A traves de solicitudes de infor- 
macion, obtuvieron cuatro bases de datos: los registros de los certificados de 
defuncion, las notas forenses de cada medico, los perfiles cllnicos de los pa- 
cientes y los costos de sus tratamientos con metadona en los hospitales de 
Washington. En paralelo, recopilaron mas datos sobre el perfil socioeconomi- 
co de los fallecidos. Los archivos fueron revisados y anotados con Document- 
Cloud. Esta informacion fue pasada a Excel, luego se usd el software Access, 
que permite manejar mayor volumen de informacion, y el software ArcGIS, 
para hacer mapas. Para presentar los hallazgos se usd Google Fusion Tables, 
Tableau, Final Cut Pro y Adobe. 


IMPACTO 


Las autoridades de Washington enviaron una alerta a mas de 1.000 farma- 
ceuticos y 17.000 profesionales de la salud sobre los riesgos de la metadona. 
En enero de 2012, patrocinaron un programa que instruyd a medicos para 
limitar la metadona a casos de ultima altemativa terapeutica. 

La investigacion recibio el Premio Pulitzer 2012 en la categoria Periodismo 
de investigacion. Ese mismo ano fue premiada con el Data Journalism Award. 


(p http://goo.gl/YoQcDs 
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Gastos del 
Senado^H 

MEDICI 


La Nacion 
(Argentina) 


Fecha: Febrero 2013 


"MESSSER 9 

El equipo descubrio contratacio- 
nes, viajes y otros gastos irregula- 
res por mas de un millon de do- 
lares del Senado argentino entre 
2010 y 2012. El vicepresidente del 
senado, Amado Boudou, compro 
muebles de lujo para su oficina 
e hizo rendiciones de viaticos de 
viajes que se superponlan. 



LAS MISIONES INTERNACIONALES DE BOUDOU 

En lo que va del ano ya realizo el doble de viajes al exterior que en 201 2 


7 misiones en 2012 1 4 misiones en 2013 (hasta agosto) 



> Filtre por ano 

Todos 


NALISIS DE DATOS: 


Un informante anonimo envio a La Nacion un correo electronico que con- 
tenia una fotografia del despacho del vicepresidente del Senado argentino, 
Amado Boudou, con una lujosa mesa importada desde Italia. Este hecho puso 
a trabajar al equipo periodistico en la descarga de 33.000 documentos de las 
contrataciones del senado que estaban en su web oficial. Se usd el software 
Omnipage 18 para convertir los PDF en archivos rastreables. La informacion 
paso a un Excel que incluia los gastos en muebles, pagos de viajes, y gastos 
de personal de seguridad, entre otros. Se utilizo Tableu Public para explorar la 
data y hacer graficos interactivos. Para manejar parte de los PDF se desarrollo 
la plataforma colaborativa VozData que permitia la participacion de volunta- 
ries para clasificar la informacion en un formato preestablecido. 


IMPACTO: 


La Fiscalia inicio una investigacion de los viajes del vicepresidente del Sena- 
do. El tema fue tratado en television, radios y otros periodicos. 

El trabajo obtuvo el Data Journalism Award 2013 en la categoria Data-Driven 
Investigation (Big Media), organizado por el Global Editors Network (GEN). 
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q ) http://www.lanacion.com.ar/gastos-en-el-senado-t49163 


EL PODEROSO 
NE04J 

[0 como descubrir 
unfraude global 
con circulosy 
Uneas] 


Mar Cabra, editora de la Unidad de Investigacion y Datos 
del ICIJ, aprendio a usar desde hojas de calculo 
hasta sofisticados software para seguir el rastro 
de la corrupcion fiscal y corporativa en millones de 
archivos que, en apariencia, no tenian conexion directa 
entre si. Para la serie Swiss Leaks usd una herramienta 
llamada Neo4j, que permite identificar conexiones 
entre grandes cantidades de datos y mostrarlas en 
graficos. “Las conexiones eran cruciales para identificar 
quien hacia negocios con quien”, conto Cabra durante 
la Conferencia Global de Periodismo de Investigacion 
realizada en octubre de 2015 en Lillehammer, Noruega. 
En lugar de tablas, esta herramienta usa nodos y 
aristas, lo que hace mas intuitiva la lectura de las 
relaciones entre datos. 


Esta funcion permitio al equipo de OjoPublico 
desentranar el rastro del financiamiento de los partidos 
en la campana electoral peruana del 2016, a partir del 
cruce de 16 bases de datos y el analisis de 3 millones 
de registros. “Este sistema nos permitio comprender, 
analizar y cruzar simultaneamente las bases de 
datos”, explica Nelly Luna, la periodista a cargo de la 
investigacion. Lo que antes hubiera tornado varios 
anos, con la herramienta apenas tomo seis meses. 








Casas 

embargadas 


Homes for the Taking. Liens, 
losses and profiteers 


MEDIO 


The Washington 

Post 

(EE.UU.) 


Fecha: Septiembre 2013 


33E3333EE1 

Unas 200 personas de Washin- 
gton DC., en su mayoria adultos 
mayores, perdieron sus viviendas 
en ejecuciones hipotecarias irre- 
gulares por deudas tributarias de 
menos de mil dolares. Estos casos 
evidenciaron abusos en el progra- 
ma de retencion de impuestos del 
distrito que permitieron a compa- 
nias inmobiliarias hacerse de las 
propiedades. 


http://goo.gl/ZGtrUP 

e> 


sections = Sljelltosljington JJost 


Share ^ 


Where tax lien 
foreclosures occur in 
the District 

Dots on the map show foreclosures that 
followed tax hens since 2005, and the 

Minorities are hit the hardest 

72 % 

neighborhoods where less than 20% of 
the population is white. 

Areas with the most pending 
foreclosures 

0149 

0141 

Congress Heights, Bellevue, 



Chillum. 


Pending foreclosures 


Search for an address 
or neighborhood 



Edgewood, 
Bloomingdale, 
Truxton Circle, 
Eckington 

19 

foreclosures since 2005 


I 102 residentia 


I 11 vacant 
I 13 other 




NALISIS DE DATOS 


La investigacion se baso en el analisis de los documentos de ejecuciones hi- 
potecarias entre los anos 2005 y 2013 disponibles de la Oficina de Impuestos 
y Rentas, la Corte Superior y la Oficina del Censo de Estados Unidos. El equipo 
armo una base de datos de 200 propietarios adultos mayores que perdieron 
sus casas en subastas que hizo el programa de retencion de impuestos del 
distrito por el atraso de pagos de menos de mil dolares. En la mayoria de los 
casos, las propiedades fueron vendidas a compamas inmobiliarias pese a que 
los duehos originales finalmente pagaron sus deudas. Cuando los reporteros 
buscaron a las victimas obtuvieron mas indicios de los abusos cometidos. 
Uno de los afectados agonizaba de cancer y debia 1.025 dolares en impuestos. 
Otro tenia 95 anos de edad y padecia Alzheimer, por lo que olvido cancelar un 
saldo de apenas 44 dolares. Los documentos fueron examinados con Docu- 
mentCloud y los datos fueron analizados con hojas de calculo. Los hallazgos 
fueron trabajados con las plataformas Mapbox y la libreria de codigo abierto 
Leaflet), que permite hacer mapas amigables para moviles. 


IMPACTO 


Una docena de senadores solicito al gobiemo investigar los programas de 
impuestos con el fin de proteger a los propietarios vulnerables de perder sus 
inmuebles por pequenas deudas tributarias. 

La investigacion gano el premio Data Journalism Award 2014 en la categorla 
Data-Driven Investigation. 
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Jadeantes y 
agobiadosB 


Breathless and Burdened 


MEDIO 


Centro para 
la Integridad 
Publica (EE. 

UU.) y Unidad de 
Investigacion de 
ABC News 


Fecha: Octubre 2013 


33E33S3EE1 

Medicos y abogados al servicio de 
la industria del carbon han blo- 
queado las ayudas a los mineros 
afectados por la enfermedad del 
pulmon negro. 


ANALISIS DE DATOS 


El reportero Chris Hamby se propuso construir una base de datos con in- 
formacibn de los examenes de rayos X practicados a mas de 1.500 mineros 
en el Hospital Johns Hopkins desde el ano 2000 hasta el 2013. Las mineras 
de carbon les habian negado el tratamiento de salud y pagos de beneficios 
sociales en base a diagnosticos firmados por un solo medico, quien descarto 
que tuvieran la enfermedad del pulmon negro. Los mineros judicial izaron sus 
casos. El periodista accedio a esos expedientes para construir una segunda 
base de datos sobre las estrategias legales de las mineras, los reportes de otros 
medicos, y los veredictos de los jueces. Hamby paso meses leyendo y proce- 
sando la informacion en hojas de calculo. De esta manera pudo identificar 
casos y patrones que evidenciaban un sistema montado para negar beneficios 
a los mineros. 


Breathless and Burdened 

A 19-year fight for benefits 

By Chris Hamby a Chris Zubak-Skees □ email 6:00 am, November 1, 2013 Updated 12:19 pm. Way 19. 2014 
J □ cS EH Comment Emai 

Former miner Ted Latusek has tried for almost two decades to prove that the scarring in his lungs was caused by coal mine dust. Doctors testifying for the company 
have denied any link between his particular pattern of disease and his work, despite increasing recognition of this form of illness by government agencies and 
independent researchers. Click on a gavel to read the decision. 



IMPACTO 


El Hospital Johns Hopkins suspendio y luego separo al medico responsable del 
programa de deteccion de pulmon negro. Por otro lado, senadores de EE.UU. 
elaboraron proyectos de ley para reformar el sistema de beneficios de los mi- 
neros de la industria del carbon. 

La investigacion gano el premio Pulitzer del 2014 en la categoria de Periodis- 
mo de Investigacion. 


(p http://goo.gl/ZPZ9HE 














OpenStreetMap 

http://www.openstreetmap.org/ 


, Proyecto colaborativo para crear mapas libres y editables. 

CARTOGRAFIA Se pueden usar datos geograficos capturados con 
DIGITAL dispositivos GPS moviles y otras fuentes. 


[ Recursos para 
ubicar los hechos 
y persona) es en el 
lugar exacto] 


My Maps 

https://www.google.eom/maps/d/u/0/ 


Herramienta para crear mapas a traves del Google Maps. 
Es facil de usar, compartir e insertar gracias al codigo que 
proporciona. El unico requisito es tener una cuenta de 
Google. 


MapBox 

http://mapbox.com/tour/ 


Sitio web que permite crear mapas personalizados de 
manera sencilla. Usa software libre. 


InfoAmazonia 

http://infoamazonia.org/ 


Sitio web que cuenta con mapas ambientales de los nueve 
paises de la region amazonica. 


Geocommons 


Programa gratuito para crear mapas con multiples capas. 
Permite utilizar la informacion geolocalizada de otros 
usuarios y compartirla. 


Medicare 

Desenmascarado 


Medicare Unmasked 


MEDIO 


The Wall Street 

Journal 

(EE.UU.) 


Fecha: Abril 2014 


3SS3SSSEB 

Medicare, el programa de ayuda 
sanitaria a personas con mas de 
65 arios y jovenes con graves en- 
fermedades, realizo pagos por 60 
billones de dolares anuales a mas 
de 880.000 medicos, servicios de 
ambulancia y lab oratorios, varios 
de los cuales fueron casos de frau- 
de, derroche y abusos. 


» RICHARD H. BROWN M.D. 


2012 2013 


f Medical Oncology 

1970 GOLF ST | SARASOTA, FLA. 


$8,362,862 

Change 2012-13: +16.66% 


Compare to other providers: Nationally Statewide Regionally 


Provider Comparison, 2012 and 2013 


Patient Comparison, 2013 see data for 2012 


How RICHARD H. BROWN M.D. compares to 7 other providers in the How Medicare patients in the Sarasota, Fla. region 

Sarasota, Fla. area specializing in Medical Oncology: compare nationally: 


Total Payments 

2012 

2013 

2012-13 Change 


$7,168,759.89 

100th percentile regionally 

$8,362,862 

100th percentile regionally 

+16.66% 


Number of Patients 

2012 

2013 

2012-13 Change 


1,603 

1,714 

+6.92% 


100th percentile regionally 
86 th percentile regionally 


Payments per patient 


Health Status: 

Medicare patients here have 
fewer serious health conditions. 
(National average is 1.0)* 

0.96 

0.6 1.0 1.4 

< More healthy Less healthy ► 


Average annual cost to Medicare 
per patient... 

$9,191 $9,415 

Sarasota, Fla. Nationally 



ANALISIS DE DATOS: 


En mayo de 2014, tras una batalla de cinco arios en tribunales, el WSJ con- 
siguio que el Gobierno de EE.UU. liberara casi 10 millones de registros de 
contratos y desembolsos de Medicare a sus proveedores de servicios medicos, 
mantenidos en secreto desde 1979. Luego accedieron a una segunda base de 
datos comprada a la agenda CMS (Centers for Medicare and Medicaid Servi- 
ces), que incluia registros de reclamos de pago de proveedores en un periodo 
de 6 arios. El cruce de informacion permitio construir una base de datos que 
sirvio para detectar casos de fraude, sobrecostos y abusos en un programa 
que gasta mas de 60 billones de dolares anuales. Los periodistas y expertos 
en datos utilizaron el lenguaje de programacion C# para convertir los registros 
en tablas relacionales y desarrollaron algoritmos para hacer conexiones con 
los datos. Luego importaron la informacion al gestor Microsoft SQL. Con esa 
data produjeron graficos interactivos, rankings y una plataforma de busqueda 
de los pagos a cada medico. 


IMPACTO: 


Ganador del Pulitzer 2015 en la categoria Periodismo de Investigacion. 


http://graphics.wsj.com/medicare-billing/ 







Ln nnoon precio combustibles 


f * 8* 


Aresep mm 

encarece 
gasolina y 
diesel para 
abaratar asfalto 


La Nacion 
(Costa Rica) 


Fecha: Diciembre 2014 


33Z3SSQS 

En el 2008, la Autoridad Regu- 
ladora de los Servicios Publicos 
de Costa Rica (Aresep) aprobo en 
secreto una formula de calculo 
precios que encareria el diesel y la 
gasolina para abaratar las tarifas 
del gas y el asfalto. Este subsidio 
cruzado beneficiaba a las empre- 
sas cementeras en perjuicio de mi- 
les de usuarios. 


PAIS IMPORTA AL MEJOR PRECIO, PERO VENDE EL LITRO MAS CARO DEL ISTMO 

Impuesto, subsidio y costos de Recope 
borran compra barata de gasolina 

H Precio de imporlacion M Impuesto H Margen de dislribuidor H Margen gasolineras Otros am Subsidio cruzado 

Panama I 
El Salvador I 
Guatemala I 
Honduras I 
Nicaragua I 
Costa Rica 


NALISIS DE DATOS 


Las periodistas Hassel Fallas y Mercedes Aguero crearon en forma manual 
una base de datos en Excel con informacion extraida de 59 resoluciones de 
precios, ordinarias y extraordinarias, emitidas por la Aresep entre junio de 
2009 y septiembre de 2014. Los componentes de la formula de precios se 
desagregaron para averiguar como se incluian los costos operativos de la Re- 
finadora Costarricense de Petroleo (Recope) en la tarifa de los combustibles. 
Con ayuda de especialistas, se detecto que la Aresep habia establecido un 
subsidio cruzado: asignaba a un producto un costo superior al real con el fin 
de reducir el precio de otro. En este caso, se aumentaba el costo del diesel y 
la gasolina para abaratar el del asfalto y el gas. El equipo tuvo que construir 
cinco versiones de la bases de datos hasta dar con la correcta. 


IMPACTO 


La Aresep modified la formula para calcular el precio de los combustibles y 
asi eliminar los costos ocultos en la metodologia que empleaba desde el 2008. 
La investigacion fue final ista en los Data Journalism Awards 2015, de la GEN, 
en la categoria Investigacion del ario. 
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g? http://goo.gl/aNriTd 


La conquista 
del favor^H 


Courting Favor 


MEDIO 


The New York 

Times 

(EE.UU.) 


Fecha: Octubre 2014 


ZHZ3ESEE] 

Mas de 20 corporaciones, entre las 
que figuran DirecTV, Pfizer, Coca 
Cola, Google y Citigroup hicieron 
regalos y contribuciones a fiscales 
generates en 12 estados para in- 
fluenciar en sus decisiones. 


ANALISIS DE DATOS 


Durante una investigacion de nueve meses, el periodista de The New York 
Times Eric Lipton comprobo como ha penetrado el lobby corporativo en los 
fiscales generates para forcer sus decisiones en favor de los intereses de 21 
companias. 

Lipton consiguio, a traves de peticiones legates, 8.000 paginas de correos elec- 
tronicos de las cuentas publicas de los fiscales e hizo una base de datos en 
una hoja de calculo con informacion extraida de estas correspondencias en 
las que se evidenciaban las relaciones de los funcionarios y las empresas. 
Luego, documento los regalos y contribuciones que reciben los fiscales de 
las corporaciones que investigan. Esa informacion fue complementada con 
fotografias y viajes que el reportero hizo a conferencias academicas de fiscales 
patrocinadas por dichas empresas. 

Para completar su informe, Lipton mostro que las contribuciones de las com- 
panias a las asociaciones de fiscales democratas y republicanos se cuadrupli- 
caron en cuatro arios. 


IMPACTO 


Las publicaciones generaron investigaciones en cuatro estados y el Senado 
planted un proyecto de ley que prohibe que los funcionarios reciban regalos o 
contribuciones economicas. 

Courting Favor fue galardonado con el Pulitzer 2015 en la categoria de Perio- 
dismo de Investigacion y con el IRE Award en la categoria Print/Online-Large. 


(p http://goo.gl/oKMMKg 
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EL CAMINO 
HACIA UNA 
CULTURA DE 
INNOVACION 


Los laboratories digitales 
del periodismo de investigation 
en el Peru 


La comunidad de los datos en el Peru 


OjoPublico 

Laboratorio de innovacion 
enfocado en el periodismo de 
investigacion y las nuevas 
narrativas digitales. 

http://ojo-publico.com/ 


Open Data Peru 

Comunidad que promueve la 
apertura y reutilizacion de 
datos abiertos en el Peru y 
la creacion de aplicaciones 
civicas. 

http://odpe.org/ 



Convoca.pe 

Sitio digital de periodismo 
de investigacion que reune a 
reporteros, analistas de datos 
y desarrolladores. 
http:Zconvoca.pe/ 


HacksHackers 

Lima 

Capitulo peruano de la 
comunidad internacional 
HacksHackers que promueve 
la alianza entre periodistas y 
programadores. 
http://hhlima.info/ 


HackSpace 

Espacio de creacion e 
innovacion digital dirigida a 
universitarios, investigadores 
y publico interesado en la 
tecnologia. 

http://hackspace.pe/ 
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A ntes de que el periodismo se amistara con la estadis- 
tica, la periodista Liz Mineo detecto una forma de ras- 
trear la corruption con tablas numericas. A fines de 
1997, mientras el Peru era sacudido por frecuentes denuncias sobre 
malos manejos del gobierno de turno, Mineo puso atencion en las 
obras publicas de prevention ante el Fenomeno del Nino, un proceso 
ciclico de alteraciones climaticas que suele desencadenar desastres 
en distintos puntos del pais. La reportera se planted una pregunta 
basica: ^Como se habia gastado el publicitado presupuesto publico 
de cien millones de soles para esos trabajos? El problema era que 
el regimen de entonces no se caracterizaba por su transparencia. 
Tampoco existia la ley de acceso a la information. De hecho, el Ins- 
titute Nacional de Defensa Civil (Indeci), el organismo encargado 
de administrar el dinero y hacer las contrataciones, estaba contro- 
lado por militares ligados al temido asesor presidential, Vladimiro 
Montesinos, quien habia generado un ambiente casi policiaco en el 
Estado. Al hacer sus primeras averiguaciones, Mineo encontro que 
habian declarado en reserva toda information sobre obras publicas. 
Entonces se embarco en una experiencia pionera de analisis forense 
de la information con fines periodisticos: construyo una base de da- 
tos para buscar patrones que permitieran descubrir la information 
oculta. 

En una primera etapa, la reportera de El Comercio bused fuentes 
internas. Tras un persistente trabajo de convencimiento, un funcio- 
nario del Indeci accedio a colaborar: le entrego un file de 80 paginas 
con information de las obras y los contratistas. Era el mejor insumo 
que podia obtener. “Me dio miedo que se desanimara si le pedia los 
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documentos en un disquete”, recuerda Mineo. El segundo paso fue 
trasladar toda la information a una tabla de Excel, que incluyo 293 
obras en 21 departamentos del Peru, por un monto de 100 millones 
de soles, a cargo de 61 empresas. “Eran demasiados numeros para 
hacer calculos a mano o con calculadora”, recuerda. 1 

El resultado fue un compendio de irregularidades: el primer filtro 
permitio detectar que muchas de las supuestas obras de prevention 
se concentraban en departamentos que no pertenecian al area vul- 
nerable frente al Fenomeno del Nino. Cuando averiguo quienes eran 
los accionistas de las empresas beneficiadas con los contratos, Mineo 
identified que 12 de las 61 companias eran de propiedad de compa- 
neros de armas del jefe del Indeci, el general Homero Nurena. Ade- 
mas, una de las empresas estaba a nombre de su secretaria privada 
y otra, de su sobrino. Un tercio eran empresas creadas apenas meses 
antes de recibir los contratos y algunas incluso despues de haberlos 
obtenido. 

La tercera etapa fue la verification. Mineo, con el apoyo de los 
corresponsales del diario, visito los lugares de las inversiones y des- 
cubrio obras inconclusas e incluso algunas que nunca existieron. Asi 
comprobo que el general Nurena habla beneficiado a Cajamarca, su 
ciudad natal, pese a que ese departamento no sufria los embates de 
El Nino, y que mando levantar alii una escuela primaria que luego 
bautizo con el nombre de su madre. De no haber realizado en persona 
ese recorrido, quizas los hallazgos no habrian sido tan contundentes. 

La experiencia marco un cambio en las capacidades operaciona- 
les de la periodista. En una epoca en que el Gobierno se reservaba la 
facultad de manejar la information publica, Liz Mineo combino las 
tecnicas periodisticas tradicionales con el uso incipiente de recur- 
sos propios de la mentalidad de datos para realizar una contundente 
investigation. El caso se convirtio en una serie de 15 articulos en 



8 

medios latinoamericanos tienen 
equipos periodi'sticos integrados por 
hackers para hacer analisis masivo 
de datos. En el Peru, OjoPublico y 
Convoca trabajan con programadores. 


1 Entrevista personal a Liz Mineo. 


’ fue ui 


2014 

fue un ano clave para 
la union de periodistas 
y tecnologos en el Peru: 
se abrio el capitulo de 
Hacks&Hackers en 
Lima. 



El Comercio. Tiempo despues, el general Nurena fue condenado a 
prision por malversation de fondos. 

Por mucho tiempo, esta experiencia pionera permanecio como un 
caso aislado en el panorama periodlstico peruano. Replicarla era poco 
probable en un pais con tan poco apego al registro de la realidad que 
habia quien ponia en duda hasta la fecha de cumpleanos del presi- 
dente de la Republica. 2 Al menos hasta fines del siglo XX, los archivos 
publicos peruanos adolecian de amnesia y las agendas del gobierno 
administraban sus presupuestos con algo mas parecido a la nigroman- 
cia que a la contabilidad. Los reporteros de investigation estuvieron 
concentrados en rastrear el narcotrafico, el terrorismo o la corruption. 
Tenian que descubrir esas redes a partir de fuentes directas. 

Solo a partir del 2001, con la publication de la Ley de Transpa- 
rency y Acceso a la Information Publica, las diferentes entidades 
del Estado empezaron a digitalizar sus datos y a publicarlos en sus 
plataformas en Internet. Aun asi, la informalidad de los mecanismos 
de recojo y actualization de information generaba datos poco fiables. 
Una muestra clamorosa fue detectada en el 2008 por los periodistas 
Gustavo Gorriti y Romina Mella, de IDL Reporteros (IDL-R), mien- 
tras indagaban en los registros de delitos de las comisarias en Lima 
Metropolitan. 3 Cuando solicitaron information sobre el numero y 
tipo de delitos en las distintas jurisdicciones, advirtieron que casi 
todas presentaban resultados muy similares. Al indagar un poco 
mas, descubrieron que los reportes eran llenados con un simple 
copy/paste, bajo la premisa de que en todos lados la situation era 
parecida. Los reporteros tuvieron que buscar otra manera de apro- 
ximarse al problema de criminalidad que investigaban. 

Hasta la primera decada del siglo XXI, el uso de bases de datos 
en el periodismo peruano se debio a esfuerzos individuates de re- 
porteros de investigation para seguir adelante en sus pesquisas. En 


2 VALENZUELA, Cecilia. “Buscando la cuna de Fujimori". En revista Caretas [Lima], Ver: http://www.caretas. 

com.pe/1475/fujimori/fuj imori.htm. [Visualizado: 25 de noviembre de 2015], 

3 Tornado de la exposicion de Romina Mella en inauguracion de Chicas Poderosas Pern, 20/11/15. 


el 2010, la periodista Milagros Salazar Herrera, de IDL-Reporteros, 
investigo la poderosa industria pesquera del Peru con herramientas 
digitales que le permitieron compilar, verificar y analizar en hojas de 
calculo mas de 47 mil reportes de desembarque de anchoveta, una 
especie en riesgo permanente de sobreexplotacion. Los documentos 
correspondlan a los volumenes de pesca declarados por las empresas 
y, por otro lado, a los informes de peso registrados por los superviso- 
res del Estado en los terminales del pals, entre los anos 2009 y 2010. 
El contraste al detalle permitio detectar un sistema fallido de audi- 
torla que beneficiaba a la segunda industria pesquera mas grande 
del mundo. Se habia dejado de declarar un volumen de captura que 
representaba 100 millones de dolares en impuestos. 

El reportaje de Salazar para IDL-R seria luego ampliado e incor- 
porado a una cobertura global coordinada por el Consorcio Interna- 
cional de Periodismo de Investigacion (ICIJ). En el 2012, dicho tra- 
bajo fue tambien uno de los ganadores del Premio Latinoamericano 
de Periodismo de Investigacion, entregado por el Instituto de Prensa 
y Sociedad (IPYS). 

Ese mismo ano, la Unidad de Investigacion del diario El Comer- 
cio publico una serie de reportajes sobre las empresas y los grupos 
familiares que mas se beneficiaban de las compras del millonario 
Programa de Asistencia Alimentaria (Pronaa) del Estado -que poco 
despues seria desactivado y reemplazado por el programa Qaliwar- 
ma- Se construyo en forma manual una base de datos de las contra- 
taciones de dicho programa en los ultimos diez anos, en base a los 
reportes del Sistema Electronico de Contrataciones y Adquisiciones 
del Estado (SEACE). Asi se pudo identificar a las empresas que ob- 
tuvieron mas contratos, sus propietarios y sus antecedentes. Poco 
despues, se aplico ese mismo metodo para investigar las compras de 
medicamentos por parte del Estado y se descubrio que un monopolio 
farmaceutico estaba imponiendo excesivos precios al sistema publi- 
co de salud. La fuente estrella era una hoja de calculo. 


“El periodismo de 
investigacion esta mas 
vivo que nunca. Su 
apoyo en la tecnologia ha 
logrado incrementar la 
calidad y el impacto de 
las historias”. 


David Kaplan, director del Global 
Investigative Journalism Network 
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Se iniciaba una etapa en que los periodistas exploraban nuevas 
herramientas para mejorar su capacidad de analisis y pasar del re- 
porteo a partir de un indicio particular a una investigacion general a 
partir de evidencia masiva. El proceso tendria implicancias mas alia 
de los resultados de las investigaciones: desde el enfoque para plan- 
tear investigaciones hasta el propio metalenguaje de la profesion. 

PERIODISMO + TECNOLOGIA 

Una manana de junio de 2014, en las instalaciones de un insti- 
tuto tecnologico de Lima, mas de cincuenta periodistas y progra- 
madores se reunieron por primera vez para generar herramientas 
que permitieran dar un salto en las maneras de obtener y procesar 
information. La actividad, una hackaton que duro doce horas con- 
tinuas, fue bautizada con la expresion canonica que ha guiado el 
mejor periodismo: “La ruta del dinero”. Se trataba de un ejercicio de 
vigilancia ciudadana y periodistica sobre el uso de los fondos publi- 
cos. El encuentro se realizo en simultaneo con los de otros grupos 
en doce ciudades de America Latina, pertenecientes a la comunidad 
HacksHackers, que une a periodistas y programadores dispuestos a 
reinventar los medios de comunicacion. 

La expectativa estaba alimentada por recientes revelaciones pe- 
riodfsticas con soporte tecnologico que estaban logrando alto im- 
pacto en el contexto de las elecciones municipales y regionales de 
ese ano. La mas clara era una inedita alianza entre la ONG Transpa- 
rency, un hacker y dos periodistas del popular sitio web de noticias 
Utero.pe. El resultado se llamo Verita, un software que cruzo la in- 
formacion de las hojas de vida de los mas de cien mil candidatos con 
varias bases de datos publicas, como los registros de sentencias por 
delitos civiles y penales. Los hallazgos fueron sorprendentes: 1.395 
candidatos a alcaldes y gobernadores regionales poseian condenas; 
mas de la mitad por no haber cumplido con su responsabilidad de 
pagar la pension alimentaria de sus propios hijos. 
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DOS 

TECNOLOGOS 
APOYAN AL 
PERIODISMO 


Detras del seudonimo Aniversario Peru esta un biologo 
de 35 anos y padre de dos ninas que estudia un doctorado 
en Europa y que en su tiempo libre se convierte en hacker 
cfvico. El se define como: “Un tipo que conoce algo de 
programacion y que quiere hacer accesible la informacion 
a la gente”. El artifice de los software “Verita”, que sirve 
para explorar las hojas de vida de los candidatos en 
las elecciones, y “Manolo”, que extrae informacion 
de los registros de visitas oficiales a entidades del 
Estado, cree que el buen periodismo se parece a 
la ciencia. “En Biologia o Ffsica tienes que probar una 
idea y lo haces buscando datos y analizandolos para 
llegar a una conclusion. Es lo que hace tambien un buen 
reportero de investigacion”, apunta. 


Experiencia parecida tiene el hacker Antonio Cucho, 
quien en el 2014 fundo Open Data Peru, una de 
las principales comunidades que promueven la 
liberation de informacion de interes publico y su 
conversion en herramientas informativas. Su mision no 
es facil en un pais poco transparente, pero Cucho ya ha 
logrado sumar a sus filas a 870 jovenes programadores 
y profesionales interesados en que el Estado abra 
sus datos en los dos ultimos anos. Los municipios de 
Miraflores, San Isidro y Lima han captado el mensaje y ya 
tienen portales con informacion reutilizable. 



El proyecto confirmo el nuevo rasgo del periodismo de la era del 
Big Data: el sentido colaborativo entre expertos provenientes de di- 
ferentes campos del conocimiento. Lo particular de este proyecto es 
que sus protagonistas, los periodistas Marco Sifuentes y Ernesto Ca- 
bral, y el director de la ONG Transparencia, Gerardo Tavara, nunca 
se han reunido en persona con el hacker que los ayudo. El artifice de 
la descarga y cruce masivo de toda la informacion no vive en Lima. 
Es un joven biologo peruano que estudia un doctorado en Europa 
y que en sus horas fibres se dedica a la programacion. Hasta ahora 
prefiere identificarse con el seudonimo de Aniversario Peru. 

Poco despues, el panorama periodistico peruano se dinamizo con 
el ingreso de nuevos medios independientes, de caracteristicas mas 
parecidas a las startups que a las de medios tradicionales. Se trataba 
de organizaciones pequenas, con equipos de periodistas altamente 
calificados y metodos de investigacion dinamicos. El rasgo esencial, 
que marcaba la diferencia incluso con experiencias parecidas en 
otras partes del mundo, era que su propuesta se enfoco desde el ini- 
cio en el contenido de investigacion de impacto realizado con apoyo 
de recursos digitales. 

El primero de estos medios fue OjoPublico, creado por los repor- 
teros Oscar Castilla, David Hidalgo, Nelly Luna y Fabiola Torres, de 
larga experiencia en los medios mas importantes del pais, en socie- 
dad con el programador Antonio Cucho, activista de los datos abier- 
tos y fundador de la comunidad Open Data Peru. 

OjoPublico remecio a la opinion publica con el lanzamiento de 
Cuentas Juradas, la primera aplicacion periodistica que revelo la 
evolucion del patrimonio de las autoridades locales que pretendieron 
reelegirse en el mismo proceso electoral del 2014. A traves de un 
analisis masivo de la informacion declarada por estos aspirantes en 
sus declaraciones juradas y en sus hojas de vida presentadas ante el 
organismo electoral, el portal publico una serie de investigaciones 
sobre las incongruencias, vacios y otros aspectos irregulares rela- 
cionados a sus bienes e ingresos. El trabajo se hizo en alianza con 
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la ONG Suma Ciudadana, a cargo de una parte fundamental de los 
pedidos de informacion publica por la via tradicional, y tuvo el apoyo 
de los miembros del HackSpace de la Universidad Nacional de Inge- 
nieria, que asumieron la descarga y procesamiento de buena parte 
de la informacion necesaria para el cruce de datos. 

“Si no me aliaba con los periodistas de OjoPublico, todo un ar- 
chivo gigante de declaraciones juradas de diez anos de los alcaldes 
en Lima hubiera terminado como una ruma de papel inutil”, dijo Ja- 
vier Casas, presidente de Suma Ciudadana, sobre Cuentas Juradas. 
Su organization habia reunido decenas de declaraciones juradas de 
alcaldes solicitadas a la Contraloria desde el 2012, pero tuvieron que 
pasar casi dos anos hasta que encontro a un equipo de periodistas 
dispuestos a procesar e investigar a fondo esos documentos para 
convertirlos en historias impactantes. 

Poco despues se produjo el lanzamiento del sitio digital Convoca, 
dirigido por la periodista Milagros Salazar Herrera, quien organizo 
un equipo de cinco jovenes reporteros y dos desarrolladores. Su pri- 
mer trabajo fue la construction de un registro completo de mas de 
mil doscientos procesos sancionadores abiertos por el Organismo de 
Evaluation y Fiscalizacion Ambiental (OEFA) a empresas del sector 
minero, hidrocarburos, electricidad y pesca que cometieron malas 
practicas entre 2010 y 2014. 

Esta base de datos construida por los propios periodistas, combi- 
nada con un trabajo de reporterismo de seis meses, genero la serie 
“Excesos sin Castigo: el rastro ambiental de las industrias extracti- 
vas”. El analisis revelo que las empresas mineras y petroleras mas 
multadas por el organo supervisor del Ministerio del Ambiente son 
tambien las mas reincidentes, y que habian establecido un esque- 
ma legal para apelar ante el Poder Judicial, donde habian logrado 
congelar mas de 30 millones de dolares en sanciones. Se trataba de 
otra revelation producto de un trabajo multidisciplinario, en el que 
los periodistas detectan el potential de una historia y organizan la 
estrategia y los recursos ad hoc para buscar evidencias. 


“Creemos que el futuro 
del periodismo se 
descubrira a traves de 
montones y montones de 
experimentos”. 


Corey Ford, director ejecutivo de 
Matter 
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El resultado es un curioso fenomeno en el periodismo peruano: 
en un contexto en que varios de los medios tradicionales mas impor- 
tantes contrajeron recursos para afrontar una crisis de ingresos, los 
nuevos medios digitales se convirtieron en una fuente de contenido 
de calidad, alto impacto e innovation. Los reportajes desarrollados 
por OjoPublico, Convoca y Utero.pe pasaron del online al offline 
gracias a convenios con diarios de circulation nacional, interesados 
tanto en la solidez de las investigaciones como en replicar la virali- 
dad de los reportajes en las redes sociales. 

Aunque el trabajo con bases de datos y la dinamica que requie- 
re todavia es un tema pendiente en la industria periodistica local, 
diarios como El Comercio y La Republica se han unido a la tenden- 
cia con el uso de algunas herramientas digitales gratuitas como Ta- 
bleau, para la visualization de resultados deportivos o electorales, 
o Thinglink, para contenido de entretenimiento. La inquietud por 
aprovechar la tecnologia para hacer mejor periodismo ya esta en el 
panorama. El proceso, por fortuna, es irreversible. 
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ESTUDIO DE CASO: 
Cuidados Intensivos 

[News apps o la noticia que nunca 
muere] 

E l encuentro entre periodismo y tecnologla ofrece un aba- 
nico escalable de posibilidades para exponer los hallaz- 
gos ante nuevas audiencias. Es una idea aceptada que 
mientras las visualizaciones permiten entender una historia a partir 
de un grafico, las aplicaciones permiten entender varias historias en 
una misma pieza periodlstica y dar al usuario la posibilidad de en- 
contrar vlas alternativas para consumir contenido. Es un proceso 
muy distante del traditional sentido unilateral de la information, 
la diferencia entre escuchar un discurso y tener una conversation. 
A traves de las aplicaciones ofrecemos a los lectores acceso libre a 
datos espetificos de su interes, una experiencia personal de navega- 
cion y, en consecuencia, la posibilidad de comprender un tema de la 
manera que le resulte mas comoda. 

Un claro ejemplo es Cuidados Intensivos, una aplicacion perio- 
dlstica creada por OjoPublico para investigar el sector privado de 
la salud en el Peru. En un primer nivel periodlstico, la herramienta 
revela la penetration de los grandes grupos financieros del pals en 
el negocio de cllnicas y centros medicos, que en los anos previos se 
expandieron con escasa supervision del Estado. Pero su valor para 
el lector-ciudadano-paciente es que se trata del primer registro de 
cllnicas y medicos que acumulan sanciones administrativas y pro- 
cesos penales por casos de negligencia medica y malas practicas de 
atencion a los usuarios. 
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El trabajo periodlstico 
detras de Cl 


En la investigation sobre el 
sistema privado de salud en 
el Peru y la construction de la 
aplicacion periodistica Cuidados 
Intensivos participaron cinco 
periodistas y un desarrollador. El 
equipo de reporteros trabajo los 
datos en Excel y uso el programa 
Open Refine para limpiarlos y 
cruzar la information de las 
distintas bases. 


Esta aplicacion es el resultado de la construction de bases de 
datos propias para comprender las dimensiones del sector. En una 
primera etapa se realizo 52 pedidos de acuerdo a la Ley de Transpa- 
rency y Acceso a la Information Publica. A eso se sumo la revision 
de archivos documentales y descargas masivas de datos de los sitios 
web de 44 cllnicas del pais. Este volumen permitio disenar una pla- 
taforma de busqueda que muestra las fichas de 61.372 medicos cole- 
giados, 9.920 establecimientos de salud y 21 empresas administrado- 
ras de fondos (entre Entidades Prestadoras de Salud, aseguradoras y 
las cllnicas que ofrecen sus propios programas de atencion medica). 
De este modo, la herramienta permite que cualquier usuario indague 
por su cuenta si el medico o la clinica a quienes confia su salud -e 
incluso su vida- estan autorizados para prestar servicios, cual es su 
especialidad, su nivel de eficacia y si ha recibido sanciones adminis- 
trativas o demandas judiciales por malas practicas. 

Las envergadura del trabajo de recoleccion de datos y su procesa- 
miento para obtener conclusiones relevantes permiten establecer al- 
gunas lecciones claras para cualquier periodista que desee afrontar 
un desafio de esta naturaleza: 


1. La dimension de la data se transforma 

El punto de partida de Cuidados Intensivos fue el diseno de una 
estructura de bases de datos fundamentales para entender el sector 
y la identification de todas las instituciones del Estado que tenian 
information necesaria. En esta primera fase, el equipo se propuso 
elaborar cuatro padrones: el primero, de los grupos corporativos 
con inversiones en el sector salud; el segundo, de todos los estable- 
cimientos medicos privados registrados en el pals (desde opticas y 
consultorios hasta clinicas especializadas); el tercero, de las compa- 
nias aseguradoras y administradoras de fondos de salud; y el cuarto, 
de los medicos colegiados en el Peru. 

El principal reto fue comprobar las fechas de actualization de 
los datos. Cuando los reporteros de OjoPublico solicitaron por pri- 
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mera vez el registro oficial de establecimientos medicos privados a 
la Superintendencia Nacional de Salud (Susalud), recibieron como 
respuesta que la informacion estaba publicada en el sitio web de la 
entidad. Alll, encontraron un listado de 2.500 servicios de salud par- 
ticulares. Sin embargo, un mes despues y mientras procesaban esa 
primera descarga, advirtieron que Susalud habla creado un nuevo 
formulario para clasificar la informacion de los establecimientos pri- 
vados. El nuevo padron tenia mas de 9.000 entidades registradas e 
inclula nuevos terminos. El trabajo inicial quedo incompleto y des- 
actualizado. El equipo tuvo que scrapear nuevamente todos los for- 
mularios en llnea para convertirlos en un archivo Excel. 

Un problema similar se produjo con el padron de 60 mil medicos 
colegiados. En determinado momento, al tomar muestras aleatorias 
de verification, detectaron que el Colegio Medico no actualizaba de 
manera regular las especialidades acreditadas de sus afiliados. En 
varios casos, los datos estaban incompletos. Se tuvo que subsanar 
el problema a mano, con busquedas especificas del historial de los 
especialistas. 

2. La informacion oficial es contradictoria 

El equipo realizo un segundo proceso de recoleccion de infor- 
macion de caracter mas sensible para elaborar las fichas de los es- 
tablecimientos de salud, medicos, companias aseguradoras y admi- 
nistradoras de fondos de salud. Solicitamos todas las resoluciones 
sancionadoras impuestas por el Instituto Nacional de la Competen- 
ce y de la Protection de la Propiedad Intelectual (Indecopi) con- 
tra empresas privadas de servicios de salud disponibles desde 1992 
hasta mediados de 2015. Durante ese periodo, Indecopi habia sido el 
unico organismo del Estado que se encargo de fiscalizar y sancionar 
las malas practicas del sector privado en perjuicio de los pacientes. 
Sin embargo, solo tenia resoluciones archivadas desde el 2011. 

La primera respuesta del Indecopi fue que descargaramos los 
documentos en PDF almacenados en su sitio web, pero insistimos 


Las herramientas 
digitales del proyecto 


El trabajo de programacion se 
realizo con el lenguaje Python, 
escogido por su eficiencia y 
performance. La estructura se 
hizo con el framework Django, 
que tiene un potente sistema de 
administracion de contenidos, 
ademas de ser un sistema 
modular que permite que la 
aplicacion sea escalable. Para el 
sistema de gestion de base de 
datos se eligio PostgreSQL, por su 
capacidad de almacenamiento de 
grandes cantidades de datos. Y el 
sistema de busqueda se realizo 
en Elasticsearch, que posee un 
potente motor.. 
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en que nos entregaran los documentos en fisico. Solo asi pudimos 
comprobar que el organismo disponia de mas informacion que no 
habia procesado. Al hacer el contraste encontramos 30 resoluciones 
sancionadoras contra clinicas que no aparecian en su sitio web. 

La aplicacion Cuidados Intensivos proceso mas resoluciones que 
el propio Indecopi para elaborar el ranking de clinicas con mas san- 
ciones administrativas. Ademas, con la lista completa, los periodis- 
tas pudieron verificar que la mayoria de clinicas no pago las multas 
impuestas y las impugno en el Poder Judicial. 

3. Los terminos tecnicos esconden revelaciones 

Durante la investigation, debimos empaparnos de los terminos 
tecnicos usados en el Estado para categorizar los establecimientos 
de salud. Sin el manejo de esta jerga especializada, hubieramos per- 
dido datos relevantes. Una muestra tiara aparecio al detectar un 
indicador que la Superintendencia Nacional de Salud (Susalud) de- 
nomina: nivel de riesgo operational. El dato correspondiente era un 
porcentaje sin mayor explication. 

En la jerga oficial, este concepto se refiere al resultado de la su- 
pervision realizada por Susalud a los servicios privados para medir 
su grado de cumplimiento de las normas de atencion a los pacientes 
(condiciones y equipamiento de los servicios de emergencia, unidad 
de Cuidados Intensivos, farmacia, etc.). Los inspectores de Susalud 
consignaban como nivel de riesgo lo que en realidad correspondfa 
al porcentaje de cumplimiento. De este modo, cuando en los repor- 
tes se decla que una cllnica presentaba “Nivel de riesgo operational: 
6%”, lo que en realidad se revelaba era que el establecimiento no 
cumplfa el 94% de las normas de atencion. El impacto del dato cam- 
biaba de manera radical. 

Para comprender la terminologfa, los periodistas recurrieron a 
expertos que les ayudaron a explicarla en un lenguaje sencillo para 
los usuarios y que fue colocada en las fichas de los establecimientos 
de salud evaluados de una manera comprensible. 
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4. Si la base de datos no existe, siempre hay 
formas de construirla 

Uno de los mayores retos fue resolver la falta de informacion. El 
Peru carece de un registro oficial sobre negligencias medicas sancio- 
nadas. La informacion fue solicitada al Ministerio de Salud, el Cole- 
gio Medico, la Asociacion de Clinicas Particulares y el Poder Judi- 
cial. Ninguna de estas instituciones disponla archivo alguno sobre el 
tema. Resolvimos construir una primera base a partir de las denun- 
cias aparecidas en los medios de comunicacion, que luego hubieran 
sido formalizadas ante el sistema de justicia. 

Para ello, parte del equipo se sumergio en los archivos de tres de 
los periodicos mas grandes del pais: El Comercio, La Republica y Ojo. 
Revisamos el periodo de 1991 hasta mediados del 2015 y luego volca- 
mos la informacion a una tabla de Excel con los siguientes campos: 
nombre de la victima, clinica u hospital donde ocurrio la negligencia, 
medico o profesional de salud denunciado, breve description de los 
hechos, y ano de la ocurrencia. Con este panorama, contrastamos los 
nombres de los medicos y de los establecimientos involucrados en los 
registros del Ministerio Publico y el Poder Judicial. Solo los casos 
formalizados (con sentencia o en proceso abierto) fueron incluidos. 

5. Si la informacion cuesta, date el gusto de 
liberarla 

Las fichas de las empresas que prestan servicios de salud tienen 
informacion que proviene de la Superintendencia Nacional de Regis- 
tros Publicos (Sunarp) y del Poder Judicial. El pequeno detalle es 
que ambas entidades del Estado cobran una tasa por cada busqueda. 
Para consultar cada partida registral de la Sunarp hay que abonar 
cuatro soles, y una sola empresa puede tener varias actas registrales. 
En el Poder Judicial, por cada reporte para conocer el estado de una 
demanda debe pagarse un sol. El equipo decidio asumir el costo para 
acceder a la informacion de unas 50 empresas en las que se concen- 
tre la investigation y libero los datos en Cuidados Intensivos. 
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WORKSHOPS 

PARA 

REPORTEROS 

[Organizaciones 
aliadas para 
combinar 
periodismoy 
tecnologia ] 


Investigative Reporters & Editors, IRE 

http://www.ire.org/ 


Organiza conferencias y cursos de capacitacion para 
periodistas. Su sede esta en la Escuela de Periodismo de la 
Universidad de Missouri. Dirige el programa NICAR, que 
promueve el uso de bases de datos para la investigation 
periodistica. 


Global Investigative Journalism Network 

http://www.globalinvestigativejournalism.org/ 


La Red Mundial de Periodismo de Investigation, creada 
en 2003 en Copenhague, organiza la Conferencia Global 
de Periodismo de Investigation cada dos anos. Su proximo 
evento sera en Johannesburgo, Sudafrica, en el 2017. 


Centro Knight para el Periodismo en las 
Americas 

http://www.knightcenter.utexas.edu/ 


Entrena en forma permanente a periodistas de America 
Latina y el Caribe en las ultimas herramientas digitales a 
traves de seminarios gratuitos en linea. Entre sus expositores 
estan los periodistas lideres en el uso de bases de datos. 


Internacional Center for Journalists, ICFJ 

http://www.ijnet.org/ 


Esta organization ofrece entrenamiento en periodismo de 
investigation y herramientas digitales. Tiene un programa 
para desarrollo de proyectos periodisticos innovadores. 




Habemus 

o no habemus data 

[Ley de Transparencia vs. Ley de 
Proteccion de Datos Personales] 


T rece anos despues de que entrara en vigencia, la Ley de 
Transparencia y Acceso a la Informacion Publica en el 
Peru se ha convertido en una herramienta imprescindi- 
ble para los periodistas de investigation. Sin embargo, hay varios 
retrocesos en esta materia. El principal escollo es el criterio que al- 
gunos funcionarios aplican a la informacion personal. En junio de 
2015, el abogado Javier Casas solicito a la Contraloria General de 
la Republica una copia de la declaration jurada de ingresos, bie- 
nes y rentas del presidente de la Republica, Ollanta Humala, con 
el argumento de que este documento es publico y puede solicitar- 
se de acuerdo a ley. Tras cuatro meses de insistentes reclamos, Ca- 
sas recibio una carta en que se rechazaba su pedido con una dudosa 
explication: las declaraciones juradas son informacion privada de los 
funcionarios publicos reguladas por la Ley de Proteccion de Datos 
Personales desde el 2011. 

Casas, presidente de la ONG Suma Ciudadana y especialista en 
leyes de acceso a la informacion, considero que la Contraloria habia 
pasado por alto el precepto constitutional que establece como una 
obligation del Estado la difusion de las declaraciones juradas de los 
funcionarios para el control ciudadano. Pero el caso evidencio algo 
mas: las fricciones entre la ley que promueve la apertura de los datos 
publicos y otra que los organismos estatales han empezado a utilizar 
a discretion para cerrar el acceso a los mismos. 
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pedidos de acceso a la 
informacion realizados por 
periodistas u organizaciones 
de la sociedad civil han sido 
rechazados o respondidos de 
manera incompleta por el 
Estado entre 2003 y 
2015. 
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Meses antes, Casas habia entrevistado al jefe de la Autoridad Na- 
tional de Proteccion de Datos Personales (ANPDP), Jose Quiroga 
Leon, quien aseguro lo siguiente: “Las declaraciones juradas de los 
funcionarios publicos no requieren consentimiento de los titulares 
para ser entregadas, porque no estan dentro de lo que regula la nor- 
ma de proteccion de datos personales”. El argumento de la Contra- 
loria era entonces una interpretation particular para negar dicha 
informacion. 

La paradoja de esta situation es que el Estado gasta 11 millones 
de soles al aho en mantener una Secretaria de Gestion Publica para 
promover la apertura de la informacion y, al mismo tiempo, varios 
de sus ministerios y organismos niegan las solicitudes hechas por 
ciudadanos y periodistas. 

Una revision de los informes del Centro Liber, el Instituto de Pren- 
sa y Sociedad (IPYS) y la Defensoria del Pueblo permite identificar 
17 entidades publicas que entre el 2003 y 2015 se negaron a respues- 
ta a pedidos de informacion publica, lo hicieron en forma partial o 
fuera del plazo limite. La mayoria de estos pedidos de informacion 
tenia fines periodlsticos. 

iPodemos leer los correos de un ministro? 

A mediados de 2014, los grupos de hackers Anonymous y Lulz Se- 
curity fueron los artifices de la mas grande filtration de correos elec- 
tronicos de un alto funcionario del Estado en el Peru. Sus miembros 
vulneraron la cuenta del entonces primer ministro, Rene Cornejo, e 
hicieron publicos 6.482 mensajes. La prensa bautizo el caso como los 
‘Cornejoleaks’. 

El volumen de lo filtrado tuvo gran impacto politico y mediatico, 
porque no solo revelo los presuntos lobbies secretos de los miembros 
del gabinete a favor de distintas corporaciones, sino que abrio un 
debate juridico sobre el caracter publico de las comunicaciones ofi- 
ciales de las autoridades. 
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Entre los correos hackeados al entonces premier habia una ca- 
dena de mensajes entre los ministros de Energia y Minas, Eleodo- 
ro Mayorga, y de Ambiente, Manuel Pulgar Vidal, sobre una norma 
aprobada para beneficiar en forma directa a companias del sector hi- 
drocarburos. Cuando los periodistas empezaron a reportar este he- 
cho, el Centro Liber, una organization sin fines de lucro que promue- 
ve la transparency en el Estado, pidio al despacho de Mayorga copia 
de los “correos electronicos recibidos por el ministro a su cuenta de 
correo oficial o a cualquier otra que le haya sido creada en el minis- 
terio, con sus respectivas respuestas, en las cuales se haya comuni- 
cado con cualquier persona para tratar asuntos relacionados con el 
Nuevo Reglamento Nacional de Hidrocarburos o sus similares”. La 
solicitud se hizo basada en la Ley de Transparency y Acceso a la In- 
formation Publica, pero fue rechazada. El ministerio argumento que 
ese pedido violaba el secreto de las comunicaciones del ministro. 

Entonces el presidente del Centro Liber, el ex procurador anti- 
corruption Julio Arbizu, decidio presentar un habeas data con el 
argumento de que el contenido de la conversation del ministro de 
Energia y Minas era de interes publico y no violaba de forma alguna 
su privacidad y el secreto de sus comunicaciones. 

El caso quedo en manos del juez Hugo Velasquez Zavaleta, del 
Quinto Juzgado Constitutional de Lima, quien declare fundada la 
demanda de habeas data casi un ano despues, cuando Mayorga ya 
habia dejado el cargo. “La information publica que puede solicitarse 
y que la administration estatal esta obligada a entregar, puede cons- 
tar en cualquier forma de expresion, ya sea grafica, sonora, visual, 
electromagnetica o que obre en cualquier otro soporte material”, in- 
dica el fallo de junio de 2015. La decision considero que “con la evo- 
lution de la tecnologia, la comunicacion ya no se efectua solo a traves 
del soporte de papel, sino a traves de otros medios, como los correos 
electronicos”. 

El juez Velasquez se baso en dos principios: el de publicidad y 
el de maxima divulgation. El primero se encuentra regulado en el 
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“La reutilizacion de 
datos hechos publicos 
por el Estado permite al 
ciudadano el ejercicio del 
derecho de acceso a la 
informacion”. 


Miguel Morachimo, director de la 
ONG Hiperderecho. 


articulo 3 de la Ley de Transparency y Acceso a la Informacion Pu- 
blica, que establece que: “toda la informacion que posea el Estado se 
presume publica, salvo las disposiciones expresamente previstas”. 
El segundo principio fue desarrollado por la Corte Interamericana 
de Derechos Humanos y recogido en la jurisprudencia del Tribunal 
Constitutional: “la publicidad en la actuation de los poderes publicos 
constituye la regia general, y el secreto, cuando cuente con cobertu- 
ra constitutional, la exception”. 

El Ministerio de Energia y Minas apelo el fallo pese a que la suce- 
sora de Mayorga, la ministra Rosa Ortiz Rios, dijo en una entrevista 
en television que entregaria la informacion publica hallada en el co- 
rreo de su antecesor. 

El Centro Liber tambien presento recursos de habeas data para 
solicitar correos de los ministros de Agricultura, Milton Von Hesse, 
y de Economia, Luis Castilla, en los que hubieran tratado asuntos 
directamente relacionados a su gestion. Al cerrarse este manual, 
ambos procesos seguian pendientes de fallo judicial. 

En el debate sobre estos casos quedo claro que el periodista tiene 
en la Ley de Transparency una herramienta poderosa para acceder 
a informacion sobre temas sensibles que atanen tanto a la gestion 
de funcionarios especificos como a las politicas publicas. No es una 
Have inmediata a la evidencia, pero deberia ser uno de los criterios 
esenciales en la mentalidad del periodista de investigation. 
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El dilema existencial: 
tCuando un dato privado 
es de interes publico? 


E n julio de 2011, la Presidencia del Consejo de Ministros 
(PCM) promulgo la Ley de Proteccion de Datos Perso- 
nates con el fin de garantizar el adecuado tratamiento 
de la information privada de cualquier ciudadano. En teorla, es una 
norma positiva, pues evita la divulgation de datos sensibles (sobre 
salud, patrimonio personal, etc.), muy abundantes en la era digital. 
La norma no regula ni restringe el uso de datos publicos, pero admi- 
te zonas grises que han castigado el uso de bases de datos de acceso 
publico que contienen nombres y datos de personas. 

Un claro ejemplo es el caso del portal Datos Peru. En octubre 
de 2014, la Autoridad National de Proteccion de Datos Personates | 
(APDP) multo con S/. 228.000 al sitio por replicar las normas lega- | 
les, nombramientos y sanciones administrativas contra funciona- 
rios y empleados del Estado publicadas originalmente en el boletin 
de normas legates que viene adjunto al diario oficial El Peruano, una 
information que de por si es publica aunque pocos se den el trabajo 
de revisarla. 

Dos personas hablan solicitado a los administradores del sitio web 
que eliminaran la information sobre sus casos, pero ellos se negaron 
a hacerlo por tratarse de datos recogidos de un documento publico. 
Segun la APDP, Datos Peru incumplio la Ley de Proteccion de Da- 
tos Personates por no tener el consentimiento de las personas para 
publicar esa information, pese a que el mismo contenido aparecla 
tambien en los portales de El Peruano y del Ministerio de Justicia. 



indicadores tiene el Plan de 
Action de Gobierno Abierto 


2012-2014, pero no han 
sido cumplidos en su 
totalidad. 
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“Se necesita una 
autoridad autonoma que 
siga y ftscalice la entrega 
de informacion publica, 
porque los funcionarios 
encargados estan 
limitados por las ordenes 
de sus superiores”. 


Roberto Pereira, Centro Liber. 


Esta fue la primera sancion que efectuo la APDP y genero contro- 
versias, en principio, por la evidente contradiction de criterios para 
determinar lo publico y lo privado cuando la misma informacion se 
divulga en un portal del Estado o en un sitio particular. A eso se su- 
maba una preocupacion mayor: las posibles repercusiones de ese cri- 
terio para la practica periodfstica y la vigilancia ciudadana. ^Puede 
un funcionario decretar el secreto sobre lo que el propio Estado esta 
obligado a informar? Y en un sentido mas esencial: ^Donde empieza 
y donde termina el interes publico? 

En plena epoca en que el mundo se encamina hacia una cultu- 
ra de datos abiertos, los periodistas de investigation tienen varios 
obstaculos por superar. El primer paso es conocer todas las herra- 
mientas disponibles para obtener la informacion y para procesarla 
luego de manera innovadora. Hasta hace un tiempo, se trataba de un 
proceso mas cercano a la artesania y la intuition. La poderosa union 
de periodismo y tecnologia ha enriquecido los metodos y estandares 
de la profesion. Mas que un set de nuevos instrumentos, tenemos un 
recurso estrategico. Es, como esta dicho, un bagaje diverso y practi- 
co, parecido a una navaja suiza. 
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LA LETRA 
PEQUENA: 
COMO HACER 
UN PEDIDO DE 
INFORMACION 
EFICAZ 



La Ley de Transparencia y Acceso a la Informacion 
Publica establece que los organismos publicos tienen 
como plazo siete dias habiles, despues de haber 
recibido una solicitud, para emitir una respuesta. En 
caso de demora, tienen cinco dias de prorroga para 
entregarla, previa comunicacion al solicitante. 

Segun el Manual Ciudadano para el Acceso a la 
Informacion Publica, elaborado por el Consejo de la 
Prensa Peruana, si un organismo publico incumple 
la ley, como en varios de los casos presentados, los 
ciudadanos tienen derecho a presentar un habeas 
data. Este recurso legal no solo precede cuando la 
institucion publica rechaza un pedido de informacion, 
sino tambien cuando la que entrega es ambigua o 
cuando no emite respuesta alguna en los siguientes 
diez dias habiles posteriores al pedido recibido. El 
reportero tambien puede presentar un habeas data 
cuando la entidad nego el acceso a determinada 
informacion luego de que se presento una apelacion 
dirigida al funcionario responsable con la indicacion 
de que sea revisada por su superior jerarquico. En 
estos casos, sin necesidad de estar representado por un 
abogado, el periodista tiene 60 dias habiles para 
presentar un habeas data ante el juez civil o el juez 
mixto de la zona donde vive o del lugar donde se ubica 
la institucion publica que nego su pedido. 


SOLICITUD DE ACCESO A LA 
INFORMACION PUBLICA 

Nombre de la Institucion 


I. Funcionario encargado de entregar la informacion: 


Aunque 
la ley no 
determina un 
formato oficial de 
solicitud, este modelo 
ayuda a pedir 
k informacion 
publica. 


II. Datos del solicitante: 


Nombres y apellidos o razon social: 


Documento de identidad y numero: 


Direccion: 

Correo electronico: 


Numero telefonico: 


III. Informacion solicitada: 


IV. Dependencia a la que se solicita la informacion: 


V. Forma de entrega de la informacion 


Nombres y apellidos: 


Fecha: 


Firma: 


Observaciones: 


LA NAVAJA SUIZA 
DEL REPORTERO 
| 93 



SGBRE LOS AUTORES 


David Hidalgo 

Director Periodistico 
de OjoPublico 


Es autor del libro “Sombras de un 
rescate", sobre la ultima action 
armada del grupo terrorista 
MRTA. En 2006 gano el premio 
nacional de Derechos Humanos y 
Periodismo. Becario del Edward R. 
Murrow Program for Journalists del 
Departamento de Estado de EE.UU. 
Integra el equipo peruano ganador 
de los Data Journalism Awards 2015. 


Fabiola Torres L. 

Editora de Analisis de Datos 
de OjoPublico 


Periodista de investigation 
especializada en temas de salud, 
poder corporativo y gestion publica. 
Miembro del Investigative Reporters 
and Editors (IRE). Fue becaria de 
la Fundacion Kiplinger de la U. de 
Ohio, y de la Global Investigative 
Journalism Network (GIJN). Integra 
el equipo peruano ganador de los 
Data Journalism Awards 2015. 




OjoPublico 


Consejo de la Prensa Peruana 


Con el apoyo de: 


H/vos 

people unlimited 


ISBN: 978-612-47141-0-8 



ll)l\ 

INSTITUTE FOR 
DEMOCRACY AND 
ELECTORAL 
ASSISTANCE 



9 



